栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

在pandas数据框中将单元格拆分为多行

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

在pandas数据框中将单元格拆分为多行

这是使用

numpy.repeat
和的一种方法
itertools.chain
。从概念上讲,这正是您想要做的:重复某些值,链接其他值。建议用于少量的列,否则
stack
基于方法的方法可能会更好。

import numpy as npfrom itertools import chain# return list from series of comma-separated stringsdef chainer(s):    return list(chain.from_iterable(s.str.split(',')))# calculate lengths of splitslens = df['package'].str.split(',').map(len)# create new dataframe, repeating or chaining as appropriateres = pd.Dataframe({'order_id': np.repeat(df['order_id'], lens),         'order_date': np.repeat(df['order_date'], lens),         'package': chainer(df['package']),         'package_pre': chainer(df['package_pre'])})print(res)   order_id order_date package package_pre0         1  20/5/2018      p1         #1110         1  20/5/2018      p2         #2220         1  20/5/2018      p3         #3331         3  22/5/2018      p4         #4442         7  23/5/2018      p5         #5552         7  23/5/2018      p6         #666


转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/640478.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号