栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

合并多个大型DataFrame的有效方法

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

合并多个大型DataFrame的有效方法

通过使用执行索引对齐的串联,您可能会获得一些好处

pd.concat
。希望它应该比外部合并更快,更有效地利用内存。

df_list = [df1, df2, ...]for df in df_list:    df.set_index(['name', 'id'], inplace=True)df = pd.concat(df_list, axis=1) # join='inner'df.reset_index(inplace=True)

或者,您可以用

concat
迭代代替(第二步)
join

from functools import reducedf = reduce(lambda x, y: x.join(y), df_list)

这可能会更好,也可能不会更好

merge



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/637006.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号