本章内容
- 理解数据
- 认识数据分析
- 数据分析工具Python
- 集成开发环境和文本编辑器
- 使用Jupter Notebook
理解数据
需要分析的数据一般是结构化的、半结构化的、非结构化的数据集合。
大部分数据集都能够被转化为更加适合分析和建模的结构化形式。
主要的结构化数据- 表格型数据,其中各列可能是不同的类型(字符串、数值、日期等),比如报讯在关系型数据库中或以制表符/逗号为分隔符的文本文件中的那些数据。
- 多维数组(矩阵) 一维、二维、三维等多种形式
- 通过关键列相互联系的多个表,如sql中的主外键
- 间隔平均或不平均的时间序列
数据分析是指用适当地统计分析方法对收集来的大量数据进行分析,



