栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

Python学习记录 特征工程与模型聚合

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Python学习记录 特征工程与模型聚合

特征工程与模型聚合

文章目录
  • 特征工程与模型聚合
    • 什么是特征工程
    • 特征工程的主要任务
    • 特征工程的意义
    • 特征的选择
      • 特征来源
      • 选择的目标
      • 需要特征选择的原因
      • 选择的方法
    • 数据与特征的处理
      • 数据采集需要注意的点
      • 数据处理
      • 特征处理

什么是特征工程

特征工程是一项工程活动,它的目的是为了最大限度得从原始数据中提取特征以供算法和模型使用
数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限

特征工程的主要任务

从数据中抽取出对结果预测有用且高效的信息

特征工程的意义

更好的特征意味着只需要简单的模型也可以有更好的模型效果,并且还拥有着更强的灵活性

特征的选择

特征选择能剔除不相关或冗余的特征,从而达到减少特征数量,提高模型精确度,从而减少运行时间的目的

特征来源
  • 业务已经整理好的各种特征数据
  • 自己从业务中寻找高级数据特征
选择的目标
  • 寻找最优特征子集
需要特征选择的原因

特征冗余会导致相关度较高,过于消耗计算机资源
部分特征无用或有相反作用的特征容易干扰运行识别的效果

选择的方法
  • filter过滤法
  • wrapper包装法
  • embedding嵌入法
数据与特征的处理 数据采集需要注意的点
  • 数据采集需要考虑数据能否被采集到
  • 需要考虑线上实时计算的时候获取是否快捷
  • 考虑数据对最后结果预测的影响力
数据处理

很多正负样本是不均衡的,大多数模型比对正负样本比较敏感,所以需要数据采样和数据清理

特征处理
  • 数值型
  • 类别型
  • 时间型
  • 文本型
  • 统计型
转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/864313.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号