Co to jest k-najbliższy sąsiad (k-nn)? - definicja z techopedia

2026

Spisu treści:

Definicja - Co oznacza K-Nearest Neighbor (K-NN)?
Techopedia wyjaśnia K-Nearest Neighbor (K-NN)

Definicja - Co oznacza K-Nearest Neighbor (K-NN)?

Algorytm najbliższego sąsiada k, często skracany k-nn, jest podejściem do klasyfikacji danych, która szacuje prawdopodobieństwo, że punkt danych ma być członkiem jednej lub drugiej grupy, w zależności od grupy, w której znajdują się najbliższe punkty danych .

K-najbliższy sąsiad jest przykładem algorytmu „leniwego ucznia”, co oznacza, że nie buduje modelu przy użyciu zestawu szkoleniowego, dopóki nie zostanie wykonane zapytanie zestawu danych.

Techopedia wyjaśnia K-Nearest Neighbor (K-NN)

K-najbliższy sąsiad to algorytm klasyfikacji danych, który próbuje określić, w której grupie znajduje się punkt danych, patrząc na otaczające go punkty danych.

Algorytm, patrząc na jeden punkt na siatce, próbując ustalić, czy punkt znajduje się w grupie A lub B, patrzy na stany punktów, które są w pobliżu. Zakres jest ustalany arbitralnie, ale chodzi o pobranie próbki danych. Jeśli większość punktów znajduje się w grupie A, prawdopodobne jest, że punktem danych będzie A, a nie B, i odwrotnie.

K-najbliższy sąsiad jest przykładem algorytmu „leniwego ucznia”, ponieważ nie generuje wcześniej modelu zestawu danych. Jedyne obliczenia, jakie wykonuje, są przeprowadzane w celu sondowania sąsiadów punktu danych. To sprawia, że k-nn jest bardzo łatwy w implementacji do eksploracji danych.