栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

Python Pandas使用另一列删除子字符串

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Python Pandas使用另一列删除子字符串

这是一个比您目前的解决方案要快很多的解决方案,我不相信虽然不会更快

In [13]: import numpy as np         import pandas as pd         n = 1000         testing  = pd.Dataframe({'NAME':[         'FIRST', np.nan, 'NAME2', 'NAME3',          'NAME4', 'NAME5', 'NAME6']*n, 'FULL_NAME':['FIRST LAST', np.nan, 'FIRST  LAST', 'FIRST NAME3', 'FIRST NAME4 LAST', 'ANOTHER NAME', 'LAST NAME']*n})

这是一个很长的班轮,但它应该做您需要的

我可以想出的禁食解决方案是

replace
在另一个答案中提到的:

In [37]: %timeit testing ['NEW2'] = [e.replace(k, '') for e, k in zip(testing.FULL_NAME.astype('str'), testing.NAME.astype('str'))]100 loops, best of 3: 4.67 ms per loop

原始答案:

In [14]: %timeit testing ['NEW'] = [''.join(str(e).split(k)) for e, k in zip(testing.FULL_NAME.astype('str'), testing.NAME.astype('str'))]100 loops, best of 3: 7.24 ms per loop

与您当前的解决方案相比:

In [16]: %timeit testing['NEW1'] = testing.apply(address_remove, axis=1)10 loops, best of 3: 166 ms per loop

这些为您提供与当前解决方案相同的答案



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/625379.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号