栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

在pandas中有效使用替换

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

在pandas中有效使用替换

用于

map
执行查找:

In [46]:df['1st'] = df['1st'].map(idxDict)dfOut[46]:  1st  2nd0   a    21   b    42   c    6

为了避免没有有效密钥的情况,您可以通过

na_action='ignore'

您还可以使用

df['1st'].replace(idxDict)
回答有关效率的问题:

时机

In [69]:%timeit df['1st'].replace(idxDict)%timeit df['1st'].map(idxDict)1000 loops, best of 3: 1.57 ms per loop1000 loops, best of 3: 1.08 ms per loopIn [70]:    %%timeitfor k,v in idxDict.items():    df ['1st'] = df ['1st'].replace(k, v)100 loops, best of 3: 3.25 ms per loop

因此,

map
这里的使用速度快了3倍以上

在更大的数据集上:

In [3]:df = pd.concat([df]*10000, ignore_index=True)df.shapeOut[3]:(30000, 2)In [4]:    %timeit df['1st'].replace(idxDict)%timeit df['1st'].map(idxDict)100 loops, best of 3: 18 ms per loop100 loops, best of 3: 4.31 ms per loopIn [5]:    %%timeitfor k,v in idxDict.items():    df ['1st'] = df ['1st'].replace(k, v)100 loops, best of 3: 18.2 ms per loop

对于30K行df,

map
速度要快约4倍,因此扩展性好于
replace
或循环



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/638854.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号