P:
Dlaczego wybór funkcji jest tak ważny w uczeniu maszynowym?
ZA:Wybór funkcji jest niezwykle ważny w uczeniu maszynowym przede wszystkim dlatego, że służy jako podstawowa technika kierowania wykorzystania zmiennych do tego, co jest najbardziej wydajne i skuteczne dla danego systemu uczenia maszynowego.
Eksperci rozmawiają o tym, jak wybór funkcji i ekstrakcja funkcji działają w celu zminimalizowania przekleństwa wymiarowości lub pomocy w radzeniu sobie z nadmiernym dopasowaniem - są to różne sposoby rozwiązania problemu nadmiernie złożonego modelowania.
Bezpłatne pobieranie: Uczenie maszynowe i dlaczego to ma znaczenie |
Innym sposobem na powiedzenie tego jest to, że wybór funkcji pomaga dać programistom narzędzia do używania tylko najbardziej odpowiednich i użytecznych danych w zestawach szkoleniowych uczenia maszynowego, co znacznie zmniejsza koszty i ilość danych.
Jednym z przykładów jest pomysł pomiaru złożonego kształtu w skali. W miarę skalowania program identyfikuje większą liczbę punktów danych, a system staje się znacznie bardziej złożony. Ale złożony kształt nie jest typowym zestawem danych, z którego korzysta system uczenia maszynowego. Systemy te mogą wykorzystywać zestawy danych, które mają bardzo zróżnicowane poziomy wariancji między różnymi zmiennymi. Na przykład, w klasyfikacji gatunków, inżynierowie mogą wykorzystać dobór funkcji do badania tylko zmiennych, które zapewnią im najbardziej ukierunkowane wyniki. Jeśli każde zwierzę na mapie ma taką samą liczbę oczu lub nóg, dane te można usunąć lub wyciągnąć inne, bardziej odpowiednie punkty danych.
Wybór funkcji jest dyskryminującym procesem, w którym inżynierowie kierują systemy uczenia maszynowego do celu. Oprócz pomysłu usuwania złożoności z systemów na dużą skalę, wybór funkcji może być również przydatny w optymalizacji aspektów tego, co eksperci nazywają „kompromisem wariancji odchylenia” w uczeniu maszynowym.
Powody, dla których wybór funkcji pomaga w analizie odchylenia i wariancji, są bardziej skomplikowane. Badanie z Cornell University na temat wyboru funkcji, wariancji odchylenia i pakowania służy do zilustrowania, w jaki sposób wybór funkcji pomaga projektom.
Według autorów artykuł „bada mechanizm, dzięki któremu wybór funkcji poprawia dokładność nadzorowanego uczenia się”.
Badanie dalej stwierdza:
Analiza empiryczna odchylenia / wariancji w miarę postępu wyboru cech wskazuje, że najdokładniejszy zestaw cech odpowiada najlepszemu punktowi kompromisu wariancji odchylenia dla algorytmu uczenia się.
Omawiając użycie silnej lub słabej trafności, autorzy mówią o wyborze funkcji jako „metodzie redukcji wariancji” - ma to sens, gdy myślisz o wariancji jako zasadniczo wielkości zmienności w danej zmiennej. Jeśli nie ma wariancji, punkt danych lub tablica mogą być zasadniczo bezużyteczne. Jeśli występuje bardzo duża wariancja, może ona przekształcić się w coś, co inżynierowie mogą uznać za „hałas” lub nieistotne, arbitralne wyniki, które są trudne do opanowania przez system uczenia maszynowego.
W świetle tego wybór funkcji jest fundamentalną częścią projektowania w uczeniu maszynowym.