栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

NLTK中没有pos_tag的ne_chunk

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

NLTK中没有pos_tag的ne_chunk

命名的实体分块器将为您提供包含分块和标签的树。您不能更改它,但是可以取出标签。从您的开始

tagged_sent

chunks = nltk.ne_chunk(tagged_sent)simple = []for elt in chunks:    if isinstance(elt, Tree):        simple.append(Tree(elt.label(), [ word for word, tag in elt ]))    else:        simple.append( elt[0] )

如果只需要块,则忽略

else:
上面的子句。您可以修改代码以任意方式包装大块。我使用nltk
Tree
将更改保持在最低限度。请注意,某些块包含多个单词(尝试在示例中添加“
New York”),因此,块的内容必须是列表,而不是单个元素。

PS。“
GPE”代表“地缘政治实体”(显然是一个大块的错误)。您可以在此处找到nltk书中的“常用标签”列表。



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/641355.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号