栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

在NLTK和Python中创建自定义分类语料库

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

在NLTK和Python中创建自定义分类语料库

这是我的问题的答案。由于我一直在考虑使用两种情况,因此我认为最好覆盖两种情况,以防将来有人需要答案。如果您具有与movie_review语料库相同的设置-
多个标签以相同的方式标记,则您希望调用标签并包含训练数据,则可以使用此文件夹。

reader = CategorizedPlaintextCorpusReader('~/MainFolder/', r'.*.txt', cat_pattern=r'(w+)/*')

我正在考虑的另一种方法是将所有内容放在一个文件夹中,并命名文件0_neg.txt,0_pos.txt,1_neg.txt等。您的阅读器代码应类似于:

reader = CategorizedPlaintextCorpusReader('~/MainFolder/', r'.*.txt', cat_pattern=r'd+_(w+).txt')

我希望这会在将来对某人有所帮助。



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/624153.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号