有一个名为JLangDetect的软件包,它似乎完全可以满足您的要求:
langof("un texte en français") = fr : OKlangof("a text in english") = en : OKlangof("un texto en español") = es : OKlangof("un texte un peu plus long en français") = fr : OKlangof("a text a little longer in english") = en : OKlangof("a little longer text in english") = en : OKlangof("un texto un poco mas largo en español") = es : OKlangof("J'aime les bisounours !") = fr : OKlangof("Bienvenue à Montmartre !") = fr : OKlangof("Welcome to London !") = en : OK// ...编辑:正如Kevin所指出的那样,在Nutch项目中,由org.apache.nutch.analysis.lang包提供了类似的功能。



