数据分析关键技术人工智能机器学习模式识别统计学数据库可视化技术数据分析主要步骤数据准备规律寻找规律表示数据分析发展历史及各阶段的主要算法模型介绍<20世纪70年代人工智能知识发现稳健统计描述统计探索性分析70~80年代广义线性模型研究响应值的非正态分布以及非线性模型的线性转化EM算法从非完整数据集中对参数进行MLE估计应用:处理缺失数据、截尾数据、带有噪声等的不完整数据80年代~支持向量机SVM算法应用:小样本、非线性及高维模式识别,函数拟合神经网络Bootstrap在已知数据的基础上,模拟N->无穷大时的情况通过重抽样的方法扩充数据量核光滑非参数领域数据分析的未来发展算法效率和可伸缩性处理不同类型的数据和数据源Web挖掘数据挖掘中的信息保护和数据安全数据挖掘系统的交互性探索新的应用领域数据挖掘语言或相关方面的标准化工作数据挖掘结果的可用性、确定性及可表达性各种数据挖掘结果的表达可视化数据挖掘关于算法模型的更多内容,欢迎到作者主页查看系列文章《常用数据挖掘算法从入门到精通 》,希望我的回答对大家有所帮助。
1、学习数据库知识, 掌握基础技能SQL2、技术选择:数据仓库 / ETL / 前端开发等等3、 选择技术工具:数据仓库-Oracle、SAP HANA、Hadoop都是主流;ETL- informatica 、kettle;自助式BI工具-Taleau、帆软FineBI、Power BI4、学习业务知识5、实操数据分析工作如果想系统地从概念开始学起的话,可以去天善智能的社区



