栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

python读写大文件&& GC

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

python读写大文件&& GC

最近处理一个大小为40G的数据。逻辑比较简单,按行读取,对每行进行处理,处理后写到文件中。

一次性读入,存储中间结果,一次性输出,这种模式直接OOM。试过网上各种操作 ,分批读入,使用yeild等,都不太行。

也有将文件分块处理,但IO太多。

最终决定进行批写入,完成10%后写入一次,并清空存储结构,但依然不太行。内存占用并没有下降。

最终发现python的gc居然可以手动操作,而不像JAVA完全由虚拟机来控制。

import gc

gc.collect()# 立刻进行gc

调用后,能明显看到内存的占用是一个起起伏伏的过程,gc后几乎回到了起点,确实是中间结果太大了。

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/357043.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号