栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

Python数据分析pandas类库常用方法总结

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Python数据分析pandas类库常用方法总结

一、pandas的核心是Series和Dataframe两大数据结构,其中,Series数据结构是用于存储一个序列的一维数组,而Dataframe数据结构则是用于存储复杂数据的二维数据结构

import pandas as  pd
import numpy as np
#创建一个Series   :pd.Series(序列,数组,Series ,字典{name:'zhangs',age:12,sex:'男'}   )
#通过一个序列 (列表创建)
li = [3,5,5,25,5,12,15,25]
se1 = pd.Series(li)
print(se1)

#通过一个np数组创创建一个Series
arr = np.array(['a','b','c','d'])
se2 = pd.Series(arr,index=[2,3,4,5])
arr[2] ='e'
print(arr)
print('se2:',se2)
#通过一个Series对象创建一个Series
se3 = pd.Series(se1)
print(se3)
#通过一个字典对象创建一个Series
dit ={'name':'zhangs','age':12,'sex':'男','num':101}
se3 = pd.Series(dit)
print(se3)
#1.2 查看Series 的和标签
print(se3.index)
print(se3.values)
print(se1.values)
print(se1[1])
print(se1[1:3])
print(se2[2:4])
print(se3[['name','age','num']])
print(se3['name':'sex'])
print(se1[se1>10])
#      4       3
se1 = se1 + se1[se1>10]
print(se1)

# 统计方法
l1 = [3,5,5,25,5,12,15,25]
s1 = pd.Series(l1)
a = s1.unique() #去重复
print(a)
b= s1.value_counts() #查看元素重复次数
print(b)
c =s1.isin([1,3,5,7,15]) #判断是否在列表元素中
print(c)
print(s1[c])

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/309107.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号