栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

sklearn standardscaler结果与手动结果不同

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

sklearn standardscaler结果与手动结果不同

scikit-
learn使用np.std,默认情况下是人口标准差(其中平方差的总和除以观察数),而pandas使用样本标准差(其中分母是观察数-1)(请参阅维基百科的标准差文章)。这是对总体标准偏差进行无偏估计并由自由度(

ddof
)确定的校正因子。因此,默认情况下,numpy和scikit-
learn的计算使用,
ddof=0
而pandas使用
ddof=1
(docs)。

Dataframe.std(axis = None,skipna = None,level = None,ddof = 1,numeric_only =
None,** kwargs)

返回要求轴上的样品标准偏差。

默认情况下由N-1标准化。可以使用ddof参数更改

如果您将熊猫版本更改为:

df_standardized_manual = (df - df.mean()) / df.std(ddof=0)

差异实际上为零:

        Alcohol    Malic acidAsh  Alcalinity of ash     Magnesium0 -8.215650e-15 -5.551115e-16  3.191891e-15       0.000000e+00  2.220446e-161 -8.715251e-15 -4.996004e-16  3.441691e-15       0.000000e+00  0.000000e+002 -8.715251e-15 -3.955170e-16  2.886580e-15      -5.551115e-17  1.387779e-173 -8.437695e-15 -4.440892e-16  3.164136e-15      -1.110223e-16  1.110223e-164 -8.659740e-15 -3.330669e-16  2.886580e-15       5.551115e-17  2.220446e-16


转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/625644.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号