栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

“Ran out of input” while use WikiExtractor

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

“Ran out of input” while use WikiExtractor

当使用Wikipedia Extractor(GitHub - attardi/wikiextractor: A tool for extracting plain text from Wikipedia dumps)工具处理所下载的wiki dump文件(https://dumps.wikimedia.org/zhwiki/latest/zhwiki-latest-pages-articles.xml.bz2)时 当我执行python命令

python Wikiextractor.py -b 10M -o zh_extracted zhwiki-latest-pages-articles.xml.bz2

时 出现了

EOFError: Ran out of input

的错误。

经过百度和google 在wikidata - EOFError: Ran out of input while use Wikipedia Extractor as a parser for Wikipedia Data Dump File - Stack Overflow中找到了解决方法 可能时因为windows系统的stringIO问题导致 如果换用linux系统运行的话就不会有问题。

 

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/268226.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号