另一个常见的操作是将一维数组上的函数应用于每一列或每一行。Dataframe的apply方法正是这样做的:
In [116]: frame = Dataframe(np.random.randn(4, 3), columns=list('bde'), index=['Utah', 'Ohio', 'Texas', 'Oregon'])In [117]: frameOut[117]: b d eUtah -0.029638 1.081563 1.280300Ohio 0.647747 0.831136 -1.549481Texas 0.513416 -0.884417 0.195343Oregon -0.485454 -0.477388 -0.309548In [118]: f = lambda x: x.max() - x.min()In [119]: frame.apply(f)Out[119]: b 1.133201d 1.965980e 2.829781dtype: float64许多最常见的数组统计信息(例如sum和mean)都是Dataframe方法,因此不必使用apply。
也可以使用基于元素的Python函数。假设你要根据帧中的每个浮点值来计算格式化的字符串。你可以使用applymap做到这一点:
In [120]: format = lambda x: '%.2f' % xIn [121]: frame.applymap(format)Out[121]: b d eUtah -0.03 1.08 1.28Ohio 0.65 0.83 -1.55Texas 0.51 -0.88 0.20Oregon -0.49 -0.48 -0.31
之所以使用
applymap作为名称,是因为
Series具有用于应用逐元素函数的map方法:
In [122]: frame['e'].map(format)Out[122]: Utah 1.28Ohio -1.55Texas 0.20Oregon -0.31Name: e, dtype: object
总结起来,apply在Dataframe的行/列基础上工作,在Dataframe applymap上按map元素工作,在Series上按元素工作。



