栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

countDistinct和distinct.count之间的区别

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

countDistinct和distinct.count之间的区别

df.agg(countDistinct("member_id") as "count")

返回该

member_id
列的不同值的数量,而忽略所有其他列,而

df.distinct.count

将计算Dataframe中不同 记录 的数量-其中“ distinct”表示 所有 列的值相同。

因此,例如,Dataframe:

+-----------+---------+|member_name|member_id|+-----------+---------+|          a|        1||          b|        1||          b|        1|+-----------+---------+

仅具有一个不同的

member_id
值,但具有两个不同的记录,因此该
agg
选项将返回1,而后者将返回2。



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/414704.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号