栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

用appengine-mapreduce达到内存限制

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

用appengine-mapreduce达到内存限制

您的输入文件可能超出了软内存的大小限制。对于大文件,请使用

BlobstoreLineInputReader
BlobstoreZipLineInputReader

这些输入阅读器传递与

map
函数不同的东西,它们传递
start_position
文件和文本行中的。

您的

map
函数可能类似于:

def time_count_map(data):    """Time count map function."""    text = data[1]    try:        reader = csv.reader([text.replace('', '')], skipinitialspace=True)        for s in reader: """Calculate time elapsed""" sdw = s[1] start_date = time.strptime(sdw,"%m/%d/%y %I:%M:%S%p") edw = s[2] end_date = time.strptime(edw,"%m/%d/%y %I:%M:%S%p") time_difference = time.mktime(end_date) - time.mktime(start_date) yield (s[0], time_difference)    except IndexError, e:        logging.debug(e)

使用

BlobstoreLineInputReader
可以使作业更快地运行,因为它可以使用多个分片(最多256个),但这意味着您需要上传未压缩的文件,这可能会很麻烦。我通过将压缩文件上传到EC2
Windows服务器来处理它,然后从那里解压缩并上传,因为上游带宽很大。



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/662574.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号