栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

pandas学习笔记

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

pandas学习笔记

目录

文件读取

数据统计

表格操作

数据标准化

数据筛选

数据连接

apply



文件读取
try:
    df_sheet=pd.read_csv(file_name, encoding='utf-8')
except UnicodeDecodeError:
    df_sheet=pd.read_csv(file_name, encoding="gb18030")

数据统计
​#数据分析
info(),describe(),head()

#数据统计
mean:平均值    X.列名.unique()/value_counts():内容统计​

#获取不重复值
dataframe['xxx'].unique()

表格操作
#列名,重命名
 zyd_df.rename(columns={"资源CUID":"机房/资源点CUID"},inplace=True)

数据标准化
#填充平均值
X_train["Age"].fillna(X_train["Age"].mean(),inplace=True) 

数据筛选
#逻辑:loc["条件","列名"]
X_train.loc[X_train['Sex']=='female','Sex']=0

#删除筛选
df=df[ ~ df['站点类别'].str.contains('核心站点')]

#删除重复项
df1.duplicated()#判断是否重复
bbu_data.drop_duplicates()#删除重复项
df1.drop_duplicates(['A'],inplace=True)#根据某列删除重复项

数据连接
#关联vlookup
result = pd.merge(c_df,zd_df.loc[:,['所属站点','站点CUID']],how='left',on = '所属站点')
  
#连接
df_merge=pd.concat([df_merge,df_sheet],axis=0,ignore_index=True)

apply
df=df.apply(lambda x :x["A"], axis=1)

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/744492.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号