该错误表明机器没有足够的内存来一次将整个CSV读入
Dataframe。假设你一次也不需要整个数据集都在内存中,那么避免该问题的一种方法是分批处理CSV(通过指定chunksize参数):
chunksize = 10 ** 6for chunk in pd.read_csv(filename, chunksize=chunksize): process(chunk)
该
chunksize参数指定每个块的行数。(当然,最后一块可能少于
chunksize行。)

该错误表明机器没有足够的内存来一次将整个CSV读入
Dataframe。假设你一次也不需要整个数据集都在内存中,那么避免该问题的一种方法是分批处理CSV(通过指定chunksize参数):
chunksize = 10 ** 6for chunk in pd.read_csv(filename, chunksize=chunksize): process(chunk)
该
chunksize参数指定每个块的行数。(当然,最后一块可能少于
chunksize行。)
下一篇 假设网易考拉在有道词典投放广告,请写出至少3种不同创意方向的广告文案,并阐述原因。要求其中一个创意方向需结合最新的热点话题。每个文案限制20个字以内。(网易考拉是网易旗下的一款海淘购物APP)