栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

数据分析概论

数据分析概论

1、数据分析方向:现状分析、原因分析、预测分析

离线数据:对历史数据进行批处理(eg:一周一次)

实时数据:流处理(毫秒级)

预测数据:机器学习(分类、聚类、关联、预测)

2、数据分析思路

    明确分析目的和分析思路数据收集:业务数据RDBMS、日志数据(服务器、应用日志)、爬虫数据、互联网公开数据数据处理:数据清洗、数据转化、数据提取、数据计算变成结构化数据数据分析:用户行为理论、PEST分析法(政治/经济/社会/科技)、5W2H分析法数据展现:数据可视化报告撰写:对分析结果进行总结

3、大数据5V特征

    Velocity:数据增长快、获取数据速度快、数据处理速度快Value:低密度价值,需要从海量数据中挖掘价值Veracity:数据质量,数据准确可信Variety:种类来源多样化,文字图片音频Volume:数据体量大TB级别

4、分布式和集群

分布式:多台机器(服务旗),每台机器上部署不同的组件,不同组件相互作用。               分布式存储、分布式计算

集群:多台机器,每台机器上部署相同的组件,比如百度在不同的地方部署相同的搜索服务器

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/784292.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号