Spisu treści:
Definicja - Co oznacza K-oznacza Clustering?
Klastrowanie K-oznacza to prosty algorytm uczenia bez nadzoru, który służy do rozwiązywania problemów klastrowania. Postępuje zgodnie z prostą procedurą klasyfikowania danego zestawu danych do pewnej liczby klastrów, określonych literą „k”, która jest wcześniej ustalana. Klastry są następnie pozycjonowane jako punkty, a wszystkie obserwacje lub punkty danych są powiązane z najbliższym klastrem, obliczane, korygowane, a następnie proces rozpoczyna się od nowa z wykorzystaniem nowych korekt, aż do osiągnięcia pożądanego rezultatu.
Klaster K-oznacza znajduje zastosowanie w wyszukiwarkach, segmentacji rynku, statystykach, a nawet astronomii.
Techopedia wyjaśnia K-Means Clustering
Klastrowanie K-średnich jest metodą stosowaną do analizy skupień, szczególnie w eksploracji danych i statystyce. Ma on na celu podzielenie zestawu obserwacji na kilka klastrów (k), co skutkuje podzieleniem danych na komórki Voronoi. Można to uznać za metodę ustalenia, do której grupy naprawdę należy dany obiekt.
Jest stosowany głównie w statystyce i może być stosowany do prawie każdego kierunku studiów. Na przykład w marketingu można go wykorzystać do grupowania różnych danych demograficznych osób w proste grupy, które ułatwiają marketingowcom docieranie do odbiorców. Astronomowie używają go do przesiewania ogromnych ilości danych astronomicznych; ponieważ nie mogą analizować każdego obiektu jeden po drugim, potrzebują sposobu, aby statystycznie znaleźć interesujące miejsca do obserwacji i badań.
Algorytm:
- Punkty K są umieszczane w przestrzeni danych obiektu reprezentującej początkową grupę centroidów.
- Każdy obiekt lub punkt danych jest przypisany do najbliższego k.
- Po przypisaniu wszystkich obiektów pozycje k centroidów są ponownie obliczane.
- Kroki 2 i 3 są powtarzane, aż pozycje centroidów przestaną się poruszać.
