【深度学习】一维数组的 K-Means 聚类算法理解

刚看了这个算法,理解如下,放在这里,备忘,如有错误的地方,请指出,谢谢

需要做聚类的数组我们称之为【源数组】

需要一个分组个数K变量来标记需要分多少个组,这个数组我们称之为【聚类中心数组】及

一个缓存临时聚类中心的数组,我们称之为【缓存聚类中心数组】

然后初始化一个K长度的数组,值随机(尽量分布在原数组的更大的区间以便计算),用于和源数组进行比对计算。

下面是计算的部分:

死循环遍历对源数据进行分组。

分组内遍历原数组的每个元素与聚类中心的每个元素的距离(差值的绝对值),将最小距离的聚类中心数组下标缓存的临时变量临时变量数组A中(长度=原数组),

创建二维数组,我们称之为【分组数组】 [聚类中心数组长度][源数组中分类的值],

遍历临时变量数组A,使用A的小标拿到原数组对应的值,赋值给分组数组。

具体公式如:

分组数组[A[i]].add(原数组[i]);

返回分组数组

对分组后的数组计算中间值存入缓存聚类中心数组,比较缓存剧烈数组和聚类数组,是否位置一样,值一样,如果一样跳出死循环,分类结束,

否则将临时剧烈中心数组赋值给聚类中心数组进行下次循环

  
  
   
   
  1. using System;
  2. using System.Collections.Generic;
  3. using System.Linq;
  4. using System.Text;
  5.  
  6. namespace K_MeansTest
  7. {
  8. class Program
  9. {
  10. static void Main(string[] args)
  11. {
  12. double[] p = { 1, 2, 3, 5, 6, 7, 9, 10, 11,20,21,22,23,27,40,41,42,43,61,62,63, 100, 150, 200, 1000 };
  13. int k = 5;
  14. double[][] g;
  15. g = cluster(p, k);
  16. for (int i = 0; i < g.Length; i++)
  17. {
  18. for (int j = 0; j < g[i].Length; j++)
  19. {
  20. Console.WriteLine(g[i][j]);
  21. }
  22. Console.WriteLine(“----------------------”);
  23. }
  24. Console.ReadKey();
  25. }
  26.  
  27. /*
  28. * 聚类函数主体。
  29. * 针对一维 double 数组。指定聚类数目 k。
  30. * 将数据聚成 k 类。
  31. /
  32. public static double[][] cluster(double[] p, int k)
  33. {
  34. // 存放聚类旧的聚类中心
  35. double[] c = new double[k];
  36. // 存放新计算的聚类中心
  37. double[] nc = new double[k];
  38. // 存放放回结果
  39. double[][] g;
  40. // 初始化聚类中心
  41. // 经典方法是随机选取 k 个
  42. // 本例中采用前 k 个作为聚类中心
  43. // 聚类中心的选取不影响最终结果
  44. for (int i = 0; i < k; i++)
  45. c[i] = p[i];
  46. // 循环聚类,更新聚类中心
  47. // 到聚类中心不变为止
  48. while (true)
  49. {
  50. // 根据聚类中心将元素分类
  51. g = group(p, c);
  52. // 计算分类后的聚类中心
  53. for (int i = 0; i < g.Length; i++)
  54. {
  55. nc[i] = center(g[i]);
  56. }
  57. // 如果聚类中心不同
  58. if (!equal(nc, c))
  59. {
  60. // 为下一次聚类准备
  61. c = nc;
  62. nc = new double[k];
  63. }
  64. else // 聚类结束
  65. break;
  66. }
  67. // 返回聚类结果
  68. return g;
  69. }
  70. /
  71. * 聚类中心函数
  72. * 简单的一维聚类返回其算数平均值
  73. * 可扩展
  74. /
  75. public static double center(double[] p)
  76. {
  77. return sum(p) / p.Length;
  78. }
  79. /
  80. * 给定 double 型数组 p 和聚类中心 c。
  81. * 根据 c 将 p 中元素聚类。返回二维数组。
  82. * 存放各组元素。
  83. /
  84. public static double[][] group(double[] p, double[] c)
  85. {
  86. // 中间变量,用来分组标记
  87. int[] gi = new int[p.Length];
  88. // 考察每一个元素 pi 同聚类中心 cj 的距离
  89. // pi 与 cj 的距离最小则归为 j 类
  90. for (int i = 0; i < p.Length; i++)
  91. {
  92. // 存放距离
  93. double[] d = new double[c.Length];
  94. // 计算到每个聚类中心的距离
  95. for (int j = 0; j < c.Length; j++)
  96. {
  97. d[j] = distance(p[i], c[j]);
  98. }
  99. // 找出最小距离
  100. int ci = min(d);
  101. // 标记属于哪一组
  102. gi[i] = ci;
  103. }
  104. // 存放分组结果
  105. double[][] g = new double[c.Length][];
  106. // 遍历每个聚类中心,分组
  107. for (int i = 0; i < c.Length; i++)
  108. {
  109. // 中间变量,记录聚类后每一组的大小
  110. int s = 0;
  111. // 计算每一组的长度
  112. for (int j = 0; j < gi.Length; j++)
  113. if (gi[j] i)
  114. s++;
  115. // 存储每一组的成员
  116. g[i] = new double
    展开 收缩
    ;
  117. s = 0;
  118. // 根据分组标记将各元素归位
  119. for (int j = 0; j < gi.Length; j++)
  120. if (gi[j] i)
  121. {
  122. g[i]
    展开 收缩
    = p[j];
  123. s++;
  124. }
  125. }
  126. // 返回分组结果
  127. return g;
  128. }
  129.  
  130. /
  131. * 计算两个点之间的距离, 这里采用最简单得一维欧氏距离, 可扩展。
  132. /
  133. public static double distance(double x, double y)
  134. {
  135. return Math.Abs(x - y);
  136. }
  137.  
  138. /
  139. * 返回给定 double 数组各元素之和。
  140. /
  141. public static double sum(double[] p)
  142. {
  143. double sum = 0.0;
  144. for (int i = 0; i < p.Length; i++)
  145. sum += p[i];
  146. return sum;
  147. }
  148.  
  149. /
  150. * 给定 double 类型数组,返回最小值得下标。
  151. /
  152. public static int min(double[] p)
  153. {
  154. int i = 0;
  155. double m = p[0];
  156. for (int j = 1; j < p.Length; j++)
  157. {
  158. if (p[j] < m)
  159. {
  160. i = j;
  161. m = p[j];
  162. }
  163. }
  164. return i;
  165. }
  166.  
  167. /
  168. * 判断两个 double 数组是否相等。 长度一样且对应位置值相同返回真。
  169. */
  170. public static bool equal(double[] a, double[] b)
  171. {
  172. if (a.Length != b.Length)
  173. return false;
  174. else
  175. {
  176. for (int i = 0; i < a.Length; i++)
  177. {
  178. if (a[i] != b[i])
  179. return false;
  180. }
  181. }
  182. return true;
  183. }
  184. }
  185. }

结果如下

一维数组的 K-Means 聚类算法理解

猜你喜欢

转载自blog.csdn.net/qq_15719613/article/details/134868265
今日推荐