栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

财务python 检查重复值

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

财务python 检查重复值

背景:某个系统上传表,不能自动检查是否有重复值,需BA手动检查

需求:物料号为key,生成excel文件,一个sheet标出重复值,一个sheet为去掉重复值后的可上传表

关键点:很多文章都是显示重复数量,探究出了如何显示重复值

# 导入pandas包并重命名为pd
import pandas as pd
import time

# 读取Excel
data = pd.read_excel(r'C:Userszhengjy12PycharmProjects13表去重13.xls')
dataplus = pd.read_excel(r'C:Userszhengjy12PycharmProjects13表去重13 lj.xls')
newdata = data.append(dataplus)
newdata.tail()
print(newdata)

# 查看基于【service product ID】列去除重复行的数据
wp = newdata.drop_duplicates(['【service product ID】  '])
print(wp)

#  查看重复行,BA自行判断
s = newdata[newdata.duplicated(['【service product ID】  '],keep=False)==True]
print(s)

#为生成的excel添加时间标志
time = pd.datetime.now()
time = time.strftime('%Y-%m-%d-%H-%M')

#将去除重复行的数据输出到excel表中
writer = pd.ExcelWriter('./13去重后 %s.xlsx'%time)
s.to_excel(writer,sheet_name='重复值',index=True)
wp.to_excel(writer,sheet_name='去重复后',index=True)
writer.save()


觉得有帮助请点个赞~

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/355183.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号