实用工具小学数学练习字帖生成在线画板函数绘制拼音字母表在线词典黄历查询中国历史 Excel函数模拟请求 json格式化

栏目分类:

子分类:

名师互学网

名师互学网用户登录

快速导航

当前搜索

当前分类

前沿技术软件开发系统运维产品运营生活办公面试经验考试题库

实用工具

学习工具小学数学练习字帖生成在线画板函数绘制拼音字母表在线词典黄历查询亲戚关系计算安全期计算中国历史 Excel函数模拟请求 json格式化浏览器指纹

名师互学网 > IT > 面试经验 > 面试问答

Python，并行处理大型文本文件

面试问答更新时间：2026-05-21 22:49:18 发布时间：1646天前 IT归档最新发布模块sitemap 名妆网法律咨询聚返吧英语巴士网伯小乐网商动力

最简单的方法可能是使用现有代码一次处理所有30个文件-仍然需要花费一整天的时间，但您需要一次处理所有文件。（即，“ 9个月内有9个婴儿”很容易，“
1个月内有1个婴儿”很难）

如果您确实想更快地完成单个文件，则取决于计数器实际更新的方式。如果几乎所有工作都只是在分析价值，则可以使用多处理模块来减轻负担：

import timeimport multiprocessingdef slowfunc(value):    time.sleep(0.01)    return value**2 + 0.3*value + 1counter_a = counter_b = counter_c = 0def add_to_counter(res):    global counter_a, counter_b, counter_c    counter_a += res    counter_b -= (res - 10)**2    counter_c += (int(res) % 2)pool = multiprocessing.Pool(50)results = []for value in range(100000):    r = pool.apply_async(slowfunc, [value])    results.append(r)    # don't let the queue grow too long    if len(results) == 1000:        results[0].wait()    while results and results[0].ready():        r = results.pop(0)        add_to_counter(r.get())for r in results:    r.wait()    add_to_counter(r.get())print counter_a, counter_b, counter_c

这将允许50个slowfuncs并行运行，因此无需花费1000s（= 100k * 0.01s），而是需要20s（100k / 50）*
0.01s才能完成。如果您可以像上面那样将函数重组为“ slowfunc”和“ add_to_counter”，则应该可以使速度提高24倍。

转载请注明：文章转载自 www.mshxw.com

本文地址：https://www.mshxw.com/it/517042.html

上一篇在Flask中寻找url_for的逆函数

下一篇将字符串列表转换为以空格分隔的字符串

面试问答相关栏目本月热门文章

热门相关搜索

路由器设置木托盘宝塔面板儿童python教程心情低落朋友圈 vim 双一流学科专升本我的学校日记学校西点培训学校汽修学校情书化妆学校塔沟武校异形模板西南大学排名最精辟人生短句 6步教你追回被骗的钱南昌大学排名清朝十二帝北京印刷学院排名北方工业大学排名北京航空航天大学排名首都经济贸易大学排名中国传媒大学排名首都师范大学排名中国地质大学(北京)排名北京信息科技大学排名中央民族大学排名北京舞蹈学院排名北京电影学院排名中国戏曲学院排名河北政法职业学院排名河北经贸大学排名天津中德应用技术大学排名天津医学高等专科学校排名天津美术学院排名天津音乐学院排名天津工业大学排名北京工业大学耿丹学院排名北京警察学院排名天津科技大学排名北京邮电大学(宏福校区)排名北京网络职业学院排名北京大学医学部排名河北科技大学排名河北地质大学排名河北体育学院排名

关于我们文章归档网站地图联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号：晋ICP备2021003244-6号