点击上方“Python爬虫与数据挖掘”,进行关注
回复“书籍”即可获赠Python从入门到进阶共10本电子书
今
日
鸡
汤
寂寂花时闭院门,美人相并立琼轩。
大家好,我是我是Python进阶者。
前几天Python铂金有个叫【Lee】的粉丝问了一个数据分析的问题,这里拿出来给大家分享下。
现在的问题是:如何实现这里面老师所对应的国家呢?想要利用Python作数据分析,想了解来自美国的老师有多少个,怎么实现?针对这个demo,一开始我想的也比较简单,只需要统计其中国家的数量即可。
但是问题来了,如下图所示:
那么再用我的那个想法,就有点那个了!下面一起来看看Python是如何处理的吧。
二、实现过程这里【(这是月亮的背面)】大佬给出了两个解决方法,第一个是merge()方法,另外一个是join()方法。
方法一:merge()函数代码如下:
可以看到顺利的满足了粉丝的要求
import pandas as pd
data1 = {"学校": ['哈佛', 'MIT', '清华', '早稻田'], "国家":['美国', '美国', '中国', '日本']}
data2 = {"学校": ['哈佛', 'MIT', 'MIT', '清华', '清华', '早稻田'],
"老师": ['John', 'Mike', 'Jason', '李明', '韩磊', '武田康福']}
data1 = pd.DataFrame(data1)
data2 = pd.DataFrame(data2)
print(data1)
print(data2)
data2.merge(data1, how='left').value_counts('国家')
print(data2.merge(data1, how='left').value_counts('国家'))
print(data2.merge(data1, how='left'))
不过这还不够,粉丝后来又提需求了,如下所示:
不慌,直接将value_counts()函数去掉即可,如下:
如此,完美的满足了粉丝的需求:
方法二:join()代码如下:
join原来是用index做key连接的,这样也是可以满足粉丝的需求的。
总结大家好,我是Python进阶者。这篇文章基于粉丝提问,在实际工作中运用Python工具实现了数据批量分组的问题,在实现过程中,巧妙的运用了pandas.merge()函数和pandas.join()函数,顺利的帮助粉丝解决了问题,加深了对该函数的认识。
最后感谢粉丝【Lee】提问,感谢【(这是月亮的背面)】大佬给予的思路和代码支持,感谢粉丝【aVen】、【冫马讠成】、【水方人子】等人参与探讨和学习。
文中针对该问题,给出了两个方法,小编相信肯定还有其他的方法,欢迎大家积极尝试。
小伙伴们,快快用实践一下吧!如果在学习过程中,有遇到任何问题,欢迎加我好友,我拉你进Python学习交流群共同探讨学习。
小伙伴们,快快用实践一下吧!如果在学习过程中,有遇到任何问题,欢迎加我好友,我拉你进Python学习交流群共同探讨学习。
------------------- End -------------------
往期精彩文章推荐:
手把手教你用漫游者工具导出你在C站发布的文章并生成.md文件
Py自动化办公—Word文档替换、Excel表格读取、Pdf文件生成和Email自动邮件发送实战案例
手把手教你用Python脚本调用 DeepL API Pro 进电子书的行进行中英文自动翻译
手把手教你用Python批量创建1-12月份的sheet表,每个表的第一行都有固定3个列标题:A,B,C
欢迎大家点赞,留言,转发,转载,感谢大家的相伴与支持
想加入Python学习群请在后台回复【入群】
万水千山总是情,点个【在看】行不行
/今日留言主题/
随便说一两句吧~~



