该部分为学习笔记,具体内容详见:《利用Python进行数据分析》一书
import pandas as pd from pandas import Series, DataframePython数据分析——Pandas 入门
- 一、Pandas数据结构介绍
- 1. Series
- 2. Dataframe
- 3. 索引对象
- 二、基本功能
- 1. 重建索引
- 2. 轴向上删除条目
- 3. 索引、选择与过滤
- 4. 整数索引
- 5. 算数和数据对齐
- 6. 函数应用和映射
- 7. 排序和排名
- 8. 含有重复标签的轴索引
- 三、描述性统计的概述与计算
- 1. 相关性和协方差
- 2. 唯一值、计数和成员属性
Series 是一种一维的数组型对象,它包含了一个值序列(与 NumPy 中的类型相似),并且包含了数据标签,称为索引(index)。最简单的序列可以仅仅由一个数组形成:
2. DataframeDataframe 表示的是矩阵的数据表,它包含已排序的列集合,每一列可以是不同的值类型(数值、字符串、布尔值等)。Dataframe 既有行索引也有列索引,它可以被视为一个共享相同索引的 Series 的字典。在 Dataframe 中,数据呗存储为一个以上的二维块,而不是列表、字典或其他一维数组的集合。
3. 索引对象Pandas 中的索引对象是用于存储轴标签和其他元数据的(例如轴名称或标签)。在构造 Series 或 Dataframe 时,你所使用的任意数组或标签序列都可以在内部转换为索引对象。
二、基本功能 1. 重建索引reindex 方法
2. 轴向上删除条目drop 方法会返回一个含有指示值或轴向上删除值的新对象
3. 索引、选择与过滤 4. 整数索引 5. 算数和数据对齐 6. 函数应用和映射 7. 排序和排名 8. 含有重复标签的轴索引 三、描述性统计的概述与计算 1. 相关性和协方差 2. 唯一值、计数和成员属性


