关于kd树的原理可以看这篇http://blog.csdn.net/qll125596718/article/details/8426458
下面主要是关于李航统计学习方法中例3.2的pyhton实现:
先来贴一下运行结果:
这里还没把左右都出现的写成root。。。其他跟图3.4显示一样
下面就上一下代码:
#author:xinxinzhang
import numpy as np def loadDataSet(): T=[[2,3],[5,4],[9,6],[4,7],[8,1],[7,2]] #书上数据加载一下 return np.mat(T) def Kd_split(T): T0_var=np.var(T[:,0]) #选择x轴为坐标轴并算方差 T1_var=np.var(T[:,1]) #选择y轴为坐标轴并算方差 Tmax=max(T0_var,T1_var) #看哪个轴上的方差大,取方差大的轴 left_node=[] right_node=[] if Tmax==T0_var: #如果x轴方差大 X0_sorted=T[np.lexsort(T[:,::-1].T)] #按x轴排个序先(这里就是按第一列从小到大排序) Kd_split(X0_sorted[0,:int(len(T)/2)]) #把从小一直到中值的数继续算方差、选轴、排序 left_node.append(X0_sorted[0,int(len(T)/2)+1].T)#取中值给左节点列表 Kd_split(X0_sorted[0,int(len(T) / 2):]) #把从中值一直到大的数算方差选轴排序 right_node.append(X0_sorted[0,int(len(T)/2)].T) #取中值给右节点列表 else: X1_sorted = T[np.lexsort(T.T)] #如果y轴方差大 left_node.append(X1_sorted[0][:int(len(T) / 2)]) #取从小到中值的数给左节点 right_node.append(X1_sorted[0][int(len(T) / 2):])#取从中值到大的数给右节点 print('left_node',left_node) #打印左右节点列表 print('right_node:',right_node) T=loadDataSet() Kd_split(T)