栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

【python】———merge函数

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

【python】———merge函数

@爱学习的DUO

目录
    • 1 数据读取(A、B表)
    • 2 当右表无重复项
    • 3 当右表有重复项
      • 3.1 数据读取(C表)
      • 3.2 不对右表去重
      • 3.3 对右表去重处理
      • 3.4 总结

  • merge()表示将【左表】和【右表】,按某个均有的字段,进行横向匹配。
1 数据读取(A、B表)
import pandas as pd
A = pd.read_excel('D:/pp/test.xlsx','Sheet1');A
B = pd.read_excel('D:/pp/test.xlsx','Sheet2');B
  • A表(左),B表(右)

2 当右表无重复项

例1:有A(5行)、B(10行)两个表,按ID和key进行横向匹配。
(1)首先把B表的列名字【key】改为【ID】,以便于后续匹配。

B=B.rename(columns={'key':'ID'});B

(2)用B表去匹配A表(参数=‘left’)。

AB=pd.merge(A,B,on = ['ID'],how='left');AB
  • 结果(左表多少行,匹配结果就多少行)

    (3)用A表去匹配B表(参数=‘left’)。
BA=pd.merge(B,A,on = ['ID'],how='left');BA
  • 结果(左表多少行,匹配结果就多少行)
3 当右表有重复项 3.1 数据读取(C表)
C = pd.read_excel('D:/pp/test.xlsx','Sheet3');C
  • 结果
3.2 不对右表去重
AC=pd.merge(A,C,on = ['ID'],how='left');AC
  • 结果(发现左表行数增多)
3.3 对右表去重处理

(1)对C表的ID去重,重命名为C_qc

C_qc=C.drop_duplicates(['ID'])
C_qc
  • 去重的C表(C_qc)

    (2) 使用C表去匹配A表(参数=left)
AC1=pd.merge(A,C_qc,on = ['ID'],how='left');AC1
  • 结果
3.4 总结

可以看出,使用merge函数的时候,如果右表有重复值,会导致结果的不准确。所以一般对右表做去重处理,再与左表进行横向匹配。

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/846345.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号