栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

spark自定义函数

spark自定义函数

1.使用java,scala或者python等都可以编写自定义函数,编写完成后通过spark.udf函数注册即可使用
2.spark也支持hive自定义函数,使用类似create temporary function 函数名 as ‘’ 来注册自定义函数
3.自定义函数的执行逻辑: spark将在驱动器节点上序列化该函数,并把他通过网络发送到执行进程,然后执行进程就可以使用该自定义函数的方法执行具体逻辑
4.使用java和scale编写的自定义函数和使用python编写的自定义函数的区别在于性能上的差别:使用java/scala编写的自定义函数可以直接运行在执行进程的jvm中,而使用python编写的自定义函数要运行在python进程中,然后把结果返回给执行进程。

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/696155.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号