Pandas为此使用了矢量化字符串方法:
str.len()。要创建新列,您可以编写:
df['char_length'] = df['string'].str.len()
例如:
>>> df string0 abcd1 abcde>>> df['char_length'] = df['string'].str.len()>>> df string char_length0 abcd 41 abcde 5
这应该比使用Python
for循环在Dataframe上循环要快得多。
Pandas引入了许多其他Python熟悉的字符串方法。例如,
lower(用于转换为小写字母),
count用于计数特定子字符串的出现以及
replace用于将一个子字符串与另一个子字符串交换。



