栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

取消嵌套(爆炸)pandas DataFrame中的多个列表列的有效方法

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

取消嵌套(爆炸)pandas DataFrame中的多个列表列的有效方法

def explode(df, lst_cols, fill_value=''):    # make sure `lst_cols` is a list    if lst_cols and not isinstance(lst_cols, list):        lst_cols = [lst_cols]    # all columns except `lst_cols`    idx_cols = df.columns.difference(lst_cols)    # calculate lengths of lists    lens = df[lst_cols[0]].str.len()    if (lens > 0).all():        # ALL lists in cells aren't empty        return pd.Dataframe({ col:np.repeat(df[col].values, df[lst_cols[0]].str.len()) for col in idx_cols        }).assign(**{col:np.concatenate(df[col].values) for col in lst_cols})           .loc[:, df.columns]    else:        # at least one list in cells is empty        return pd.Dataframe({ col:np.repeat(df[col].values, df[lst_cols[0]].str.len()) for col in idx_cols        }).assign(**{col:np.concatenate(df[col].values) for col in lst_cols})           .append(df.loc[lens==0, idx_cols]).fillna(fill_value)           .loc[:, df.columns]

用法:

In [82]: explode(df, lst_cols=list('BCDE'))Out[82]:    A   B   C   D   E0  x1  v1  c1  d1  e11  x1  v2  c2  d2  e22  x2  v3  c3  d3  e33  x2  v4  c4  d4  e44  x3  v5  c5  d5  e55  x3  v6  c6  d6  e66  x4  v7  c7  d7  e77  x4  v8  c8  d8  e8


转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/507040.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号