栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

Python

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Python

通常,

iterrows
仅应在非常特殊的情况下使用。这是执行各种操作的一般优先顺序:

1) vectorization2) using a custom cython routine3) apply    a) reductions that can be performed in cython    b) iteration in python space4) itertuples5) iterrows6) updating an empty frame (e.g. using loc one-row-at-a-time)

使用自定义的

cython
例程通常太复杂了,所以现在就跳过它。

1)矢量化始终是首选。但是,有一小部分案例无法以明显的方式进行向量化(主要涉及复发)。此外,在较小的框架上,执行其他方法可能会更快。

3)应用包括可通常是通过在用

Cython
空间迭代器(这在pandas内部完成的)来进行(这是一个)的情况下。

这取决于

apply
表达式内部发生的情况。例如,
df.apply(lambda x: np.sum(x))
将很快执行(当然
df.sum(1)
更好)。但是,类似:的操作
df.apply(lambda x: x['b'] + 1)
将在python空间中执行,因此速度较慢。

4)

itertuples
不会将数据装箱成一个系列,而只是将其作为元组返回

5)是否

iterrows
将数据包装到系列中。除非你真的需要此方法,否则请使用其他方法。

6)一次更新一个空行。我已经看到这种方法使用了太多的方法。这是迄今为止最慢的。它可能很常见(对于某些

python
结构来说相当快),但是
Dataframe
对索引进行了大量检查,因此每次更新一行总是很慢。创建新的结构和方法更好
concat



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/371736.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号