栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

如何对Pandas数据框的选定列进行Pearson相关

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

如何对Pandas数据框的选定列进行Pearson相关

请注意,您的数据有误,所有3个均属于特殊col,因此无法计算相关性。

如果最后删除列选择,您将获得正在分析的所有其他列的相关矩阵。最后的[:-1]是删除’special_col’与自身的相关性。

In [15]: data[data.columns[1:]].corr()['special_col'][:-1]Out[15]: stem1    0.500000stem2   -0.500000stem3   -0.999945b1       0.500000b2       0.500000b3      -0.500000Name: special_col, dtype: float64

如果您对速度感兴趣,那么这在我的机器上会更快一些:

In [33]: np.corrcoef(data[data.columns[1:]].T)[-1][:-1]Out[33]: array([ 0.5       , -0.5       , -0.99994535,  0.5       ,  0.5       ,       -0.5       ])In [34]: %timeit np.corrcoef(data[data.columns[1:]].T)[-1][:-1]1000 loops, best of 3: 437 µs per loopIn [35]: %timeit data[data.columns[1:]].corr()['special_col']1000 loops, best of 3: 526 µs per loop

但是很明显,它返回一个数组,而不是pandas series / DF。



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/660922.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号