栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

【数据处理学习笔记】pandas

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

【数据处理学习笔记】pandas

数据读取
import pandas as pd

data = pd.read_csv('./docs/test.csv')
print(data)

控制台打印如下:

  Unnamed: 0  �ɱ�  �ۼ�  ����
0      ���޷�  180  300   100
1       �Ҿӷ�  120  250   200
2       ţ�п�   80  199   300

出现了中文乱码的情况

我们在读取csv文件时,加一下编码格式

import pandas as pd

data = pd.read_csv('./docs/test.csv', encoding='gb18030')
print(data)

控制台打印正常了

  Unnamed: 0   成本   售价   销量
0        羽绒服  180  300  100
1        家居服  120  250  200
2        牛仔裤   80  199  300
查看df的行&列索引
print('查看df的行索引:', df.index)
print('查看df的列索引:', df.columns)

控制台

查看df的行索引: RangeIndex(start=0, stop=3, step=1)
查看df的列索引: Index(['Unnamed: 0', '成本', '售价', '销量'], dtype='object')
 修改行索引/自定义索引(set_index)
df.set_index(['衣服类型'], inplace=True)
print('查看设置行索引后的df:n', df)

 控制台

查看设置行索引后的df:
        成本   售价   销量
衣服类型               
羽绒服   180  300  100
家居服   120  250  200
牛仔裤    80  199  300
查看df的行索引: Index(['羽绒服', '家居服', '牛仔裤'], dtype='object', name='衣服类型')
查看df的列索引: Index(['成本', '售价', '销量'], dtype='object')
读取表“销量”列数据
# 取出表“销量”列数据
data = df['销量']
print(data)

控制台: 

0    100
1    200
2    300
Name: 销量, dtype: int64
读取出"成本"和"销量"两列的数据
data = df[['成本','销量']]
print(data)

控制台 

    成本   销量
0  180  100
1  120  200
2   80  300
查看指定行的内容(loc)
data = df.loc['家居服']
print('读取家居服行的内容:', data)

控制台

读取家居服行的内容:
 成本    120
售价    250
销量    200
读取多行数据(loc)
data = df.loc['羽绒服':'牛仔裤']
print('读取多行数据:n',data)

 控制台

读取多行数据:
        成本   售价   销量
衣服类型               
羽绒服   180  300  100
家居服   120  250  200
牛仔裤    80  199  300
读取多行数据
data = df["羽绒服":"牛仔裤"]
print('获取多行数据:n', data)

控制台

获取多行数据:
        成本   售价   销量
衣服类型               
羽绒服   180  300  100
家居服   120  250  200
牛仔裤    80  199  300

读取指定行和指定列的值(通过索引进行访问)
  • 查看家居服的售价
price = df.loc['家居服','售价']  
print('查看家居服的售价:', price)

控制台

查看家居服的售价: 250
  • 查看家居服的销量
sales = df.loc['家居服', '销量']
print('查看家居服的销量:', sales)

控制台 

查看家居服的销量: 200
读取第一行到第二行的内容(iloc方法)
data = df.iloc[0:1]
print('取出第一行到第二行的内容:n', data)

控制台

取出第一行到第二行的内容:
        成本   售价   销量
衣服类型               
羽绒服   180  300  100
读取第1,2行,第2,3列数据
data = df.iloc[[0, 1], [1, 2]]
print('第1,2行,第2,3列数据:n', data)

控制台

第1,2行,第2,3列数据:
        售价   销量
衣服类型          
羽绒服   300  100
家居服   250  200
 读取第一行到第三行的内容(所有列)
data = df[0:2]
print('取出第一行到第三行的内容:n', data)

控制台

取出第一行到第三行的内容:
        成本   售价   销量
衣服类型               
羽绒服   180  300  100
家居服   120  250  200
获取第二行第二列的值(iat取某个单值,只能数字索引)
data = df.iat[1, 1]
print("获取第二行,第二列的值", data)

控制台

获取第二行,第二列的值: 250
 获取"羽绒服"的"售价"(at取某个单值,只能index和columns索引)
price = df.at['羽绒服', "售价"]
print('查看羽絨服的售价:', price)

控制台

查看羽绒服的售价: 300
查看行数&最后一行,第二列的值
len = len(df.values)
value = df.iat[len - 1, 1]  # 最后一行,第二列
print('查看行数:', len)
print('输出最后一行,第二列的值:', value)

控制台

查看行数: 3
输出最后一行,第二列的值: 199
查看行数&列数(shape)
print('查看行数&列数:', df.shape)
print('查看行数:', df.shape[0])
print('查看列数:', df.shape[1])

控制台

查看行数&列数: (3, 3)
查看行数: 3
查看列数: 3

数据处理 乘法运算
df['总销售额'] = df['售价'] * df['销量']  
print(df)

控制台

       成本   售价   销量   总销售额
衣服类型                      
羽绒服   180  300  100  30000
家居服   120  250  200  50000
牛仔裤    80  199  300  59700
参考资料:
  • pandas索引和行列选取总结_coolerpan的博客-CSDN博客_pandas行列索引
  • DataFrame通过行、列索引,获取指定位置的值_wenyi瑾年的博客-CSDN博客_dataframe 获取指定位置值

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/853098.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号