Spisu treści:
Definicja - Co oznacza K-Nearest Neighbor (K-NN)?
Algorytm najbliższego sąsiada k, często skracany k-nn, jest podejściem do klasyfikacji danych, która szacuje prawdopodobieństwo, że punkt danych ma być członkiem jednej lub drugiej grupy, w zależności od grupy, w której znajdują się najbliższe punkty danych .
K-najbliższy sąsiad jest przykładem algorytmu „leniwego ucznia”, co oznacza, że nie buduje modelu przy użyciu zestawu szkoleniowego, dopóki nie zostanie wykonane zapytanie zestawu danych.
Techopedia wyjaśnia K-Nearest Neighbor (K-NN)
K-najbliższy sąsiad to algorytm klasyfikacji danych, który próbuje określić, w której grupie znajduje się punkt danych, patrząc na otaczające go punkty danych.
Algorytm, patrząc na jeden punkt na siatce, próbując ustalić, czy punkt znajduje się w grupie A lub B, patrzy na stany punktów, które są w pobliżu. Zakres jest ustalany arbitralnie, ale chodzi o pobranie próbki danych. Jeśli większość punktów znajduje się w grupie A, prawdopodobne jest, że punktem danych będzie A, a nie B, i odwrotnie.
K-najbliższy sąsiad jest przykładem algorytmu „leniwego ucznia”, ponieważ nie generuje wcześniej modelu zestawu danych. Jedyne obliczenia, jakie wykonuje, są przeprowadzane w celu sondowania sąsiadów punktu danych. To sprawia, że k-nn jest bardzo łatwy w implementacji do eksploracji danych.
