前言
学习用Python数据分析与挖掘的笔记
第一章 数据挖掘基础 1.1 什么是数据挖掘
从大量数据(包括文本)中挖掘出隐含的、未知的、对决策有潜在价值的关系、模式和趋势,并用这些知识和规则建立用于决策支持的模型,提供预测性决策支持的方法、工具和过程,这就是数据挖掘。
1.2 数据挖掘的基本任务数据挖掘的基本任务包括利用分类与预测、聚类分析、关联规则、时序模式、偏差检验、智能推荐等方法。
1.3 数据挖掘建模过程1.4 常用的数据挖掘建模工具1.数据采样中,抽取数据的标准,一是相关性,二是可靠性,三是有效性
2.挖掘模型的质量不会超过抽取样本的质量
3.数据中含有噪声、不完整、不一致的数据需要进行预处理
4.对数据问题选择适合的模型构建
SAS Enterprise Miner , IBM SPSS Modeler , SQL Server , Python , WEKA , KNIME , RapidMiner , TipDM



