实用工具小学数学练习字帖生成在线画板函数绘制拼音字母表在线词典黄历查询中国历史 Excel函数模拟请求 json格式化

栏目分类:

子分类:

名师互学网

名师互学网用户登录

快速导航

当前搜索

当前分类

前沿技术软件开发系统运维产品运营生活办公面试经验考试题库

实用工具

学习工具小学数学练习字帖生成在线画板函数绘制拼音字母表在线词典黄历查询亲戚关系计算安全期计算中国历史 Excel函数模拟请求 json格式化浏览器指纹

名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

pandas统计(pandas基础)

大数据系统更新时间：2026-05-22 01:18:21 发布时间：1522天前 IT归档最新发布模块sitemap 名妆网法律咨询聚返吧英语巴士网伯小乐网商动力

一、替换操作(replace)
替换操作可以同步作用与Series和Dataframe中

df.replace(to_replace , value , replace , ...) #将所有to_replace 替换成value

df.replace(to_replace={4:5},value='five' ) #将指定列的元素进行替换，re_place{列索引：被替换的值}

df.replace(to_replace={1:'one'} ) #字典形式的替换，将1替换成‘One’

二、映射操作(map)
概念：创建一个映射关系列表，把values元素和一个特定的标签或者字符串绑定（给一个元素值提供不同的表现形式）——字典形式的映射关系表创建一个df，两列分别是姓名和薪资，然后给其名字起对应的英文名

Series_data. map( dic) #只能给Series数据进行映射(dic)

map只能是Series的方法，只能被Series调用

三、运算工具(map)
需求：超过3000部分的钱需要缴纳50%的税，计算每个人的税后薪资
四、排序实现的随机抽样

take([隐式索引]，axis=1) #将原始数据按隐式索引打乱（列打乱）

np.random.permutation(n) #产生0~n的随机数

1. 将原始数据的列打乱（axis=1）

2. 在此基础上将原始数据的行进行打乱（axis=0）

3. 随机取样

五、数据的分类处理

数据分类处理的核心
groupby(by , )函数groups属性查看分组情况

原始数据：

1. 对原始数据的水果进行分类并查看分组情况

2. 为什么要进行分组呢？为了进行聚合【分组聚合】——计算每一种说过的平均价格

3. 将计算出的每种颜色的平均重量汇总到源数据，需要用到映射——map(dic),字典数据。

六、高级数据聚合

当我们分好组之后，想进行一个聚合操作，但是这个聚合操作并没有被pandas封装，那么就需要我们自己封装一个聚合操作，例如mean()。

transform( ) #返回映射后的结果apply( ) #返回没有映射的结果

七、数据加载
1. 读取type-.txt文件

2. 将文件中每一个词作为元素存放到Dataframe中

3. 读取数据库中的数据

八、透视表
透视表是一种可以对数据动态排列并且分类汇总的表格格式。在Excel中常用，而在pandas中被称作pivot_table。透视表优点：
灵活性高，可以随意定制你的分析计算要求脉络清晰易于理解数据操作性强，报表神器
1. 导入数据

2. 参数index

3. 参数values

4. 参数aggfunc

5. 参数columns

九、交叉表

是一种用于计算分组的特殊透视表，对数据进行汇总pd.crosstab(index,columns)
index：分组数据，交叉表的行索引columns：交叉表的列索引

1. 原始数据

2. 求出各个性别（列）抽烟（行）的人数

3. 求出各个年龄段（行）抽烟（列）人的情况

转载请注明：文章转载自 www.mshxw.com

本文地址：https://www.mshxw.com/it/772146.html

上一篇 hive开发(大数据hive概念)

下一篇 pytorch训练过程可视化(pytorch特征图可视化)

大数据系统相关栏目本月热门文章

热门相关搜索

路由器设置木托盘宝塔面板儿童python教程心情低落朋友圈 vim 双一流学科专升本我的学校日记学校西点培训学校汽修学校情书化妆学校塔沟武校异形模板西南大学排名最精辟人生短句 6步教你追回被骗的钱南昌大学排名清朝十二帝北京印刷学院排名北方工业大学排名北京航空航天大学排名首都经济贸易大学排名中国传媒大学排名首都师范大学排名中国地质大学(北京)排名北京信息科技大学排名中央民族大学排名北京舞蹈学院排名北京电影学院排名中国戏曲学院排名河北政法职业学院排名河北经贸大学排名天津中德应用技术大学排名天津医学高等专科学校排名天津美术学院排名天津音乐学院排名天津工业大学排名北京工业大学耿丹学院排名北京警察学院排名天津科技大学排名北京邮电大学(宏福校区)排名北京网络职业学院排名北京大学医学部排名河北科技大学排名河北地质大学排名河北体育学院排名

关于我们文章归档网站地图联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号：晋ICP备2021003244-6号