如果数据可以被结构化 那么当今可用的大量非结构化文本数据提供了丰富的信息来源。 命名实体识别 (NER) 也称为命名实体提取 是从半结构化和非结构化文本源构建知识的第一步。
只有在 NER 之后 我们才能至少揭示信息包含的内容和内容。 因此 数据科学团队将能够在语料库中看到所有人员、公司、地点等名称的结构化表示 可作为进一步分析和调查的出发点。
在 自然语言工具包 NLTK 和 SpaCy 构建 Python 命名实体识别 文章中 我们学习并实践了如何使用 NLTK 和 spaCy 构建命名实体识别器。 为了更进一步 创建一些有用的东西 本文将介绍如何使用 spaCy 开发和部署一个简单的命名实体提取器 并使用 Python 中的 Flask API 为其提供服务。
Flask API 步骤 index.html 中处理及其代码 Python 主代码 app.py 及其分解解释 测试 Flask API 源代码详情参阅http://viadean.com/spacy_python_flask_api.html



