ک-اوسط خوشہ چینی
اصطلاح | term |
---|---|
ک-اوسط خوشہ چینی |
k-means clustering |
احصاء میں ک-اوسط خوشہ چینی طریقہ ہے خوشۂ تحلیل کا، جس کا مقصد n مشاہدات کو k خوشہ جات میں بٹوارہ کرنا ہے جہاں ہر مشاہدہ اس خوشہ سے متعلق سمجھا جائے گا جس کے اوسط سے وہ قریب ترین ہو۔
بیان
ترمیممشاہدات (x1, x2, …, xn)
کا طاقم دیا ہو،
جہاں ہر مشاہدہ d-بُعد حقیقی سمتیہ ہے، ک-اوسط خوشہ چینی کا ارادہ ان مشاہدات کو k طاقموں (k < n)
S = {S1, S2, …, Sk}
میں بٹوارہ کرنے کا ہوتا ہے، اس طرح کہ خوشہ-میں مربع کے حاصل جمع کی تصغیر ہو:
جہاں μi
اوسط ہے طاقم Si
میں نقاط کا۔
-
1) k initial "means" (in this case k=3) are randomly selected from the data set (shown in color).
-
2) k clusters are created by associating every observation with the nearest mean. The partitions here represent the Voronoi diagram generated by the means.
-
3) The centroid of each of the k clusters becomes the new means.
-
4) Steps 2 and 3 are repeated until convergence has been reached.