首先按照教材输入下列代码:
from numpy import * #导入科学计算包numpy
import operator #导入运算符模块
def createDataSet():
group = array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]])
labels = ['A','A','B','B']
return group,labels
然后要更改路径,把KNN.py文件放进去。在终端中输入下列代码:(我用的vscode)
no module name KNN ,就改文件路径,再重启
#要先进入python环境 >>>python #然后改文件路径 >>>import os >>>os.getcwd() #查看当前路径 >>>os.chdir(r'D:NLPKNN') #更改当前路径
就可以导入上面编辑的程序模块
#导入KNN模块 >>>import KNN #为了确保输入相同的数据集,KNN模块中定义了函数createDataSet #所以要创建变量group,labels >>>group,labels = KNN.createDataSet #输入变量名字,检验是否正确定义变量 >>>group >>>labels
在KNN文件中加入classify0()函数
def classify0(inX, dataSet, labels, k):
dataSetSize = dataSet.shape[0]
diffMat = tile(inX, (dataSetSize,1)) - dataSet
sqDiffMat = diffMat**2
sqDistances = sqDiffMat.sum(axis=1)
distances = sqDistances**0.5
sortedDistIndicies = distances.argsort()
classCount={}
for i in range(k):
voteIlabel = labels[sortedDistIndicies[i]]
classCount[voteIlabel] = classCount.get(voteIlabel,0) + 1
sortedClassCount = sorted(classCount.items(), #python版本问题 改成item了
key = operator.itemgetter(1), reverse= True)
return sortedClassCount[0][0]
这里有个问题:iteritems会报错,所以要改成items(python版本原因)
然后就可以预测啦
#基本上输入的就是下面的: >>>import KNN >>>group,labels = KNN.createDataSet() >>>KN.classify0([0,0], group, labels, 3)
[0,0]可以改动,来测试运行结果


![[机器学习实战] KNN [机器学习实战] KNN](http://www.mshxw.com/aiimages/31/840884.png)
