栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

Python-pandas将列表的一列分为多列

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Python-pandas将列表的一列分为多列

您可以使用

Dataframe
与构造函数
lists
通过转换为创建
numpy array
通过
values
使用
tolist

import pandas as pdd1 = {'teams': [['SF', 'NYG'],['SF', 'NYG'],['SF', 'NYG'],     ['SF', 'NYG'],['SF', 'NYG'],['SF', 'NYG'],['SF', 'NYG']]}df2 = pd.Dataframe(d1)print (df2)       teams0  [SF, NYG]1  [SF, NYG]2  [SF, NYG]3  [SF, NYG]4  [SF, NYG]5  [SF, NYG]6  [SF, NYG]df2[['team1','team2']] = pd.Dataframe(df2.teams.values.tolist(), index= df2.index)print (df2)       teams team1 team20  [SF, NYG]    SF   NYG1  [SF, NYG]    SF   NYG2  [SF, NYG]    SF   NYG3  [SF, NYG]    SF   NYG4  [SF, NYG]    SF   NYG5  [SF, NYG]    SF   NYG6  [SF, NYG]    SF   NYG

对于新的Dataframe:

df3 = pd.Dataframe(df2['teams'].values.tolist(), columns=['team1','team2'])print (df3)  team1 team20    SF   NYG1    SF   NYG2    SF   NYG3    SF   NYG4    SF   NYG5    SF   NYG6    SF   NYG

解决方案apply(pd.Series)非常慢:

#7k rowsdf2 = pd.concat([df2]*1000).reset_index(drop=True)In [89]: %timeit df2['teams'].apply(pd.Series)1 loop, best of 3: 1.15 s per loopIn [90]: %timeit pd.Dataframe(df2['teams'].values.tolist(), columns=['team1','team2'])1000 loops, best of 3: 820 µs per loop


转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/402295.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号