栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Java

Java:BreakIterator是如何取词的

Java 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Java:BreakIterator是如何取词的

BreakIterator是Java提供的一个用来判断语言边界的类。给定一个字符串和一个索引位置,BreakIterator可以根据本地语言边界限定规则,找到这个索引前后,可以和它组成词语或句子的字符的索引,我们可以根据begin和end索引来获取这个单词。

比如下面的字符串:

Hello World

当指定索引8时,也就是字符o和r之间时,用BreakIterator去分词,就可以得到World这个单词。看下面的图就能看到了。

 BreakIterator提供了四种边界判断

getWordInstance
getLineInstance
getCharacterInstance
getSentenceInstance

这里我们就以getWordInstance为例,来看看BreakIterator是如何工作的。

首先要初始化BreakIterator。

import java.text.BreakIterator;

BreakIterator bi = BreakIterator.getW
转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/601508.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号