pandas isin 长期使用速度非常快
pyspark isin 对比速度非常的慢
思路参考文章
https://www.pythonheidong.com/blog/article/400508/6b647ae338b352406ce5/
以下为改进的操作
#leftouter操作
fmqd=pd.read_excel('2022年负面清单.xlsx')
# 字段需要指定,不然会出现报错
fmqd['项目编码']=fmqd['项目编码'].astype(str)

pandas isin 长期使用速度非常快
pyspark isin 对比速度非常的慢
思路参考文章
https://www.pythonheidong.com/blog/article/400508/6b647ae338b352406ce5/
以下为改进的操作
#leftouter操作
fmqd=pd.read_excel('2022年负面清单.xlsx')
# 字段需要指定,不然会出现报错
fmqd['项目编码']=fmqd['项目编码'].astype(str)