我不确定您指的是代码/设置的更改。NLTK主要依靠机器学习,通常从训练数据中提取“设置”。
当涉及到POS标记时,结果和标记将取决于您使用/训练的标记器。如果您要自己训练,则当然需要一些西班牙语/波兰语训练数据。这些可能很难找到的原因是缺乏公开可用的金标准材料。有一些工具可以做到这一点,但是这个工具不适用于python(http://www.ims.uni-
stuttgart.de/projekte/corplex/TreeTagger/)。
nltk.tokenize.punkt.PunktSentenceTokenizer令牌生成器将根据多语言句子边界对句子进行令牌化,有关详细信息,请参见本文(http://www.mitpressjournals.org/doi/abs/10.1162/coli.2006.32.4.485)。
。



