2.获取索引:
3.获取数据:
4.Dataframe是一个类似于二维数组或表格(如excel)的对象,它每列的数据可以是不同的数据类型。
5.Pandas的Dataframe类对象创建:
6.索引获取:
7.属性获取 :
8.增减数据:
9.Pandas索引操作及高级索引:
10.Pandas中的索引都是Index类对象,又称为索引对象,该对象是不可以进行修改的,以保障数据的安全。
11.Pandas还提供了很多Index的子类,常见的有如下几种:
(1)Int64Index:针对整数的特殊Index对象。
(2)MultiIndex:层次化索引,表示单个轴上的多层索引。
(3)DatetimeIndex:存储纳秒寄时间戳。
12.reindex()方法的语法格式如下:
13.fill_value参数来指定缺失值:
14.可以通过索引的位置来获取,也可以使用索引名称来获取:
15.使用索引名称进行切片,则切片结果是包含结束位置的。
16.如果希望获取的是不连续的数据,则可以通过不连续索引来实现。
17.布尔型索引同样适用于Pandas,具体的用法跟数组的用法一样,将布尔型的数组索引作为模板筛选数据,返回与模板中True位置对应的元素。
18.算数运算与数据对齐:19.Pandas执行算术运算时,会先按照索引进行对齐,对齐以后再进行相应的运算,没有对齐的位置会用NaN进行补齐。
20.如果希望不使用NAN填充缺失数据,则可以在调用add方法时提供fill_value参数的值,fill_value将会使用对象中存在的数据进行补充。
21.数据排序:22.Pandas中按索引排序使用的是sort_index()方法,该方法可以用行索引或者列索引进行排序。
23.按索引对Series进行分别排序,示例如下。
24.按索引对Dataframe进行分别排序,示例如下。
25.Pandas中用来按值排序的方法为sort_values(),该方法的语法格式如下。
26.在Dataframe中,sort_values()方法可以根据一个或多个列中的值进行排序,但是需要在排序时,将一个或多个列的索引传递给by参数才行。
27.统计计算与描述:28.在Dataframe中,sort_values()方法可以根据一个或多个列中的值进行排序,但是需要在排序时,将一个或多个列的索引传递给by参数才行。
29. 如果希望一次性输出多个统计指标,则我们可以调用describe()方法实现,语法格式如下。
30. 层次化索引:31.前面所涉及的Pandas对象都只有一层索引结构,又称为单层索引,层次化索引可以理解为单层索引的延伸,即在一个轴方向上具有多层索引。
32.from_tuples()方法可以将包含若干个元组的列表转换为MultiIndex对象,其中元组的第一个元素作为外层索引,元组的第二个元素作为内层索引。
33.from_arrays()方法是将数组列表转换为MultiIndex对象,其中嵌套的第一个列表将作为外层索引,嵌套的第二个列表将作为内层索引。
34.根据书籍统计表,创建一个具有多层索引的Series对象,示例如下:
35. 如果商城管理员需要统计小说销售的情况,则可以从表中筛选出外层索引标签为小说的数据。
36.在Pandas中,交换分层顺序的操作可以使用swaplevel()方法来完成。
37.要想按照分层索引对数据排序,则可以通过sort_index()方法实现。
38.读写文本文件:39.to_csv()方法的功能是将数据写入到CSV文件中。
40.read_csv()函数的作用是将CSV文件的数据读取出来,转换成Dataframe对象展示。
41.to_excel()方法的功能是将Dataframe对象写入到Excel工作表中。
42.对于网页中的表格,可以使用read_html()函数进行读取,并返回一个包含多个Dataframe对象的列表。
43.read_sql()函数既可以读取整张数据表,又可以执行SQL语句。



