栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

Pyspark将列的类型从日期更改为字符串

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Pyspark将列的类型从日期更改为字符串

让我们创建一些虚拟数据:

import datetimefrom pyspark.sql import Rowfrom pyspark.sql.functions import colrow = Row("vacationdate")df = sc.parallelize([    row(datetime.date(2015, 10, 07)),    row(datetime.date(1971, 01, 01))]).toDF()

如果Spark> = 1.5.0,则可以使用以下

date_format
功能:

from pyspark.sql.functions import date_format(df   .select(date_format(col("vacationdate"), "dd-MM-YYYY")   .alias("date_string"))   .show())

在Spark <1.5.0中,可以使用Hive UDF完成:

df.registerTempTable("df")sqlContext.sql(    "SELECT date_format(vacationdate, 'dd-MM-YYYY') AS date_string FROM df")

当然,在Spark> = 1.5.0中仍然可用。

如果不使用

HiveContext
,则可以
date_format
使用UDF进行模拟:

from pyspark.sql.functions import udf, litmy_date_format = udf(lambda d, fmt: d.strftime(fmt))df.select(    my_date_format(col("vacationdate"), lit("%d-%m-%Y")).alias("date_string")).show()

请注意,它使用的是C标准格式,而不是Java简单的日期格式



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/639740.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号