将一系列int转换为字符串-为什么应用比astype快得多？

性能

值得一开始，因为任何调查，与流行的观点之前看实际表现，

list(map(str, x))

似乎是慢比

x.apply(str)

。

import pandas as pd, numpy as np### Versions: Pandas 0.20.3, Numpy 1.13.1, Python 3.6.2 ###x = pd.Series(np.random.randint(0, 100, 100000))%timeit x.apply(str)          # 42ms   (1)%timeit x.map(str) # 42ms   (2)%timeit x.astype(str)         # 559ms  (3)%timeit [str(i) for i in x]   # 566ms  (4)%timeit list(map(str, x))     # 536ms  (5)%timeit x.values.astype(str)  # 25ms   (6)

值得注意的一点：

（5）比（3）/（4）快一点，随着更多的工作移到C中[我们假设不
```
lambda
```
使用任何功能] ，我们期望。
（6）是迄今为止最快的。
（1）/（2）相似。
（3）/（4）相似。

为什么x.map / x.apply快速？

这 似乎是 因为它使用了快速编译的Cython代码：

cpdef ndarray[object] astype_str(ndarray arr):    cdef:        Py_ssize_t i, n = arr.size        ndarray[object] result = np.empty(n, dtype=object)    for i in range(n):        # we can use the unsafe version because we know `result` is mutable        # since it was created from `np.empty`        util.set_value_at_unsafe(result, i, str(arr[i]))    return result

为什么x.astype（str）慢？

熊猫适用

str

于该系列中的每个项目，而不使用上述Cython。

因此，性能可与

[str(i) for i in x]

/相媲美

list(map(str, x))

。

为什么x.values.astype（str）这么快？

Numpy不会在数组的每个元素上应用函数。我发现了对此的一种描述：

如果您做
s.values.astype(str)
了，您将得到一个持有的对象
int
。这是
numpy
在进行转换，而熊猫会遍历每个项目并调用
str(item)
它。因此，如果您
s.astype(str)
拥有对象持有权
str
。

有一个技术原因，在没有空值的情况下，尚未实现numpy版本。

将一系列int转换为字符串-为什么应用比astype快得多？

面试问答相关栏目本月热门文章