一、pandas的核心是Series和Dataframe两大数据结构,其中,Series数据结构是用于存储一个序列的一维数组,而Dataframe数据结构则是用于存储复杂数据的二维数据结构
import pandas as pd
import numpy as np
#创建一个Series :pd.Series(序列,数组,Series ,字典{name:'zhangs',age:12,sex:'男'} )
#通过一个序列 (列表创建)
li = [3,5,5,25,5,12,15,25]
se1 = pd.Series(li)
print(se1)
#通过一个np数组创创建一个Series
arr = np.array(['a','b','c','d'])
se2 = pd.Series(arr,index=[2,3,4,5])
arr[2] ='e'
print(arr)
print('se2:',se2)
#通过一个Series对象创建一个Series
se3 = pd.Series(se1)
print(se3)
#通过一个字典对象创建一个Series
dit ={'name':'zhangs','age':12,'sex':'男','num':101}
se3 = pd.Series(dit)
print(se3)
#1.2 查看Series 的和标签
print(se3.index)
print(se3.values)
print(se1.values)
print(se1[1])
print(se1[1:3])
print(se2[2:4])
print(se3[['name','age','num']])
print(se3['name':'sex'])
print(se1[se1>10])
# 4 3
se1 = se1 + se1[se1>10]
print(se1)
# 统计方法
l1 = [3,5,5,25,5,12,15,25]
s1 = pd.Series(l1)
a = s1.unique() #去重复
print(a)
b= s1.value_counts() #查看元素重复次数
print(b)
c =s1.isin([1,3,5,7,15]) #判断是否在列表元素中
print(c)
print(s1[c])



