在使用fit之前,您必须进行一些编码。如前所述,fit()不接受字符串,但是您可以解决此问题。
有几种可以使用的类:
- LabelEnprer:将字符串转换为增量值
- OneHotEnprer:使用“千分之一”算法将您的字符串转换为整数
就个人而言,前段时间我在StackOverflow上发布了几乎相同的问题。我想拥有一个可扩展的解决方案,但没有得到任何答案。我选择了将所有字符串二值化的OneHotEnprer。这是非常有效的,但是如果您有很多不同的字符串,矩阵将非常快地增长并且将需要内存。

在使用fit之前,您必须进行一些编码。如前所述,fit()不接受字符串,但是您可以解决此问题。
有几种可以使用的类:
就个人而言,前段时间我在StackOverflow上发布了几乎相同的问题。我想拥有一个可扩展的解决方案,但没有得到任何答案。我选择了将所有字符串二值化的OneHotEnprer。这是非常有效的,但是如果您有很多不同的字符串,矩阵将非常快地增长并且将需要内存。