P:
Dlaczego macierz nieporozumień jest przydatna w ML?
ZA:Istnieje wiele sposobów mówienia o tym, dlaczego macierz nieporozumień jest cenna w uczeniu maszynowym (ML) - ale jednym z najprostszych sposobów jest wyjaśnienie, że macierz nieporozumień stanowi zasób wizualizacji danych.
Macierz nieporozumień pozwala widzom zobaczyć na pierwszy rzut oka wyniki zastosowania klasyfikatora lub innego algorytmu. Korzystając z prostej tabeli do wyświetlania wyników analitycznych, macierz nieporozumień zasadniczo sprowadza wyniki do bardziej czytelnego widoku.
Macierz nieporozumień używa określonej terminologii do porządkowania wyników. Istnieją prawdziwe pozytywne i prawdziwe negatywne, a także fałszywe pozytywne i fałszywe negatywne. W przypadku bardziej skomplikowanej macierzy pomyłek lub macierzy opartej na klasyfikacji porównawczej wartości te mogą być pokazane jako rzeczywiste i przewidywane klasy dla dwóch różnych obiektów.
Niezależnie od terminologii semantycznej wyniki są pogrupowane w kwadratową (lub prostokątną) tabelę.
Ten widok ułatwia analitykom sprawdzenie, jak dokładnie algorytm klasyfikował wyniki. (Czytaj Nowe generatory wykorzystują nowoczesne algorytmy do pracy nad sztuką ASCII).
Przydatność macierzy pomieszania ma związek ze złożonością projektów ML, a także ze sposobem formatowania i dostarczania informacji użytkownikom. Wyobraź sobie szereg wyników liniowych, w tym fałszywie dodatnie, fałszywie ujemne, prawdziwe pozytywne i prawdziwe negatywne. (Czytaj Machine Learning 101.)
Użytkownik musiałby zestawić wszystkie te wyniki liniowe w postaci wykresu, aby zrozumieć, jak działa algorytm i jak bardzo był dokładny. Dzięki macierzy pomieszania informacje te są po prostu prezentowane w potężnym modelu wizualnym.
Załóżmy na przykład, że maszyna jest proszona o sklasyfikowanie 20 obrazów, z których pięć to owoce, a pięć to warzywa. Jeśli macierz pomieszania zawiera następującą zawartość (od lewego górnego rogu zgodnie z ruchem wskazówek zegara): 7, 5, 3, 5, wówczas matryca pokazuje, że siedem zostało poprawnie zidentyfikowanych jako warzywa, a trzy poprawnie sklasyfikowano jako owoce.
Pozostałe 10, jak przedstawiono, to wyniki, w których program nie mógł poprawnie zidentyfikować obrazu.
Macierz nieporozumień będzie przydatna we wszelkiego rodzaju analizach ML. Obserwując ten zasób, użytkownicy mogą dowiedzieć się, jak radzić sobie z takimi problemami, jak wymiarowość i nadmierne dopasowanie, oraz inne sposoby optymalizacji algorytmu.