栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

如何将.txt / .csv文件转换为ORC格式

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

如何将.txt / .csv文件转换为ORC格式

您可以使用Spark数据帧非常轻松地将定界文件转换为orc格式。您还可以指定/施加模式并过滤特定列。

public class OrcConvert {   public static void main(String[] args) {    SparkConf conf = new SparkConf().setAppName("OrcConvert");    JavaSparkContext jsc = new JavaSparkContext(conf);    HiveContext hiveContext = new HiveContext(jsc);    String inputPath = args[0];    String outputPath = args[1];    Dataframe inputDf = hiveContext.read().format("com.databricks.spark.csv") .option("quote", "'").option("delimiter", "01") .load(inputPath);    inputDf.write().orc(outputPath);  }}

确保满足所有依赖关系,配置单元也应运行以使用HiveContext,目前仅HiveContext支持Spark ORC格式。



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/609978.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号