先去除文本中的无关元素
将文本行拆分为单词或字符词元
※※制作字典,给每个token加上indices
整个nlp其实就是把文本中的字词符号等看作是带有时序的变量,而文本预处理就是把这些变量做成可以进行训练的东西。
上一篇 Spring Cloud组件
下一篇 Linux文件权限(rwx权限)的使用
版权所有 (c)2021-2022 MSHXW.COM
ICP备案号:晋ICP备2021003244-6号