栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

机器学习算法基础-数据降维

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

机器学习算法基础-数据降维

机器学习算法基础二
  • 数据降维
    • 特征选择
      • 特征选择的原因
      • 特征选择的方法
        • Filter-过滤式
    • 主成分分析

数据降维 特征选择 特征选择的原因

冗余:部分特征的相似性高,容易消耗计算性能
噪声:部分特征对预测结果有影响

特征选择的方法 Filter-过滤式

该方法使用sklearn.feature_selection.VarianceThreshold

VarianceThreshold(threshold=0.0):删除所有低方差特征

from sklearn.feature_selection import VarianceThreshold
X = [[0, 0, 1], [0, 1, 0], [1, 0, 0], [0, 1, 1], [0, 1, 0], [0, 1, 1]]
sel = VarianceThreshold(threshold=(.8 * (1 - .8)))
sel.fit_transform(X)
array([[0, 1],
       [1, 0],
       [0, 0],
       [1, 1],
       [1, 0],
       [1, 1]])
主成分分析

本质:一种分析,简化数据集的技术
目的:尽可能降低原数据的维度(复杂度),损失少量信息
作用:可以削减回归分析或聚类分析中特征的数量
该方法使用sklearn.decomposition

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/323900.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号