栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

在熊猫中设置联盟

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

在熊猫中设置联盟

对于这些操作,纯Python可能更有效。

%timeit pd.Series([set1.union(set2) for set1, set2 in zip(df['A'], df['B'])])10 loops, best of 3: 43.3 ms per loop%timeit df.apply(lambda x: x.A.union(x.B), axis=1)1 loop, best of 3: 2.6 s per loop

如果我们可以使用

+
,则可能会花费一半的时间(继承可能不值得):

%timeit df['A'] - df['B']10 loops, best of 3: 22.1 ms per loop%timeit pd.Series([set1.difference(set2) for set1, set2 in zip(df['A'], df['B'])])10 loops, best of 3: 35.7 ms per loop

时序的Dataframe:

import pandas as pdimport numpy as npl1 = [set(np.random.choice(list('abcdefg'), np.random.randint(1, 5))) for _ in range(100000)]l2 = [set(np.random.choice(list('abcdefg'), np.random.randint(1, 5))) for _ in range(100000)]df = pd.Dataframe({'A': l1, 'B': l2})


转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/394971.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号