栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

【汇总篇】数据分析、机器学习、数据挖掘相关实例的补充说明

【汇总篇】数据分析、机器学习、数据挖掘相关实例的补充说明

文章目录

数据可视化回归分析机器学习非结构化数据

数据可视化

离散型变量(性别、职业等):饼图、柱状图(一个离散型变量)、堆积柱状图(两个离散型变量)
连续型变量(年龄、工资等):直方图、箱线图
时间序列变量(GDP、CPI等):折线图

数据类型
横截面数据:某个时间节点上,多个对象的数据
时间序列数据:一些时间节点上,某个对象的变化数据
面板数据:多个时间节点,对同一批对象的数据

研究不同性别的年龄构成:箱线图

回归分析

回归五式:
线性回归(Y为连续型数据)股票投资、客户终身价值、医疗健康
0-1回归(Y为0-1型数据,逻辑回归、Probit Re‐gression)互联网征信、个性化推荐、社交好友推荐
定序回归(Y 为定序数据)消费者偏好市场调研(李克特1~5点量表)、豆瓣评级(1~5分)、心理测试
计数回归(Y为计数数据)客户关系管理RFM模型、肿瘤个数、生几个孩子
生存回归(Y 为生存数据)寿险精算、电子产品寿命、消费者生命周期

案例
线性回归
北京市二手房房价
中国电影票房
线上女装销量预测
股票投资中的均线
0-1回归
某移动通信公司客户流失预警分析
车险数据分析与商业价值
点击率预测在R T B广告投放中的应用
定序回归
信用卡逾期数据分析
计数回归
英超进球谁最强
生存回归
新产品在架时长研究

机器学习

朴素贝叶斯
12345,有事找政府

决策树
非诚勿扰

回归树与提升算法
二手车保值率

深度学习
图像自动识别
打麻将

K均值聚类
狗熊皮鞋的百度广告投放

非结构化数据

中文文本
小说的三要素:以《琅琊榜》为例
从用户评论看产品改善
空气净化器的好评率影响因素分析
数据分析岗位招聘情况的影响因素分析
张无忌爱谁

网络结构数据
《甄嬛站》

图像数据
通关图片识别PM2.5

刷卡数据
互联网征信

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/746121.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号