Dom Audio Dlaczego niektóre projekty uczenia maszynowego mogą wymagać ogromnej liczby aktorów?

Dlaczego niektóre projekty uczenia maszynowego mogą wymagać ogromnej liczby aktorów?

Anonim

P:

Dlaczego niektóre projekty uczenia maszynowego mogą wymagać ogromnej liczby aktorów?

ZA:

Kiedy myślisz o uczeniu maszynowym, zwykle myślisz o wykwalifikowanych naukowcach danych pracujących na klawiaturach w pokojach komputerowych. Szczególny nacisk kładziony jest na analizę ilościową i algorytmy. Wiele z tych programów nie ma bezpośredniego kontekstu rzeczywistego - przynajmniej tak wielu by pomyślało.

Jednak niektóre z najbardziej przełomowych programów uczenia maszynowego wykorzystują istne armie ludzkich aktorów na ulicy, w sklepach i wszędzie tam, gdzie mogą modelować podstawowe czynności człowieka, takie jak spacery, praca czy zakupy.

Bezpłatne pobieranie: Uczenie maszynowe i dlaczego to ma znaczenie

Artykuł przewodowy Toma Simonite'a ilustruje to bardzo dobrze trafnym tytułem „Aby uczynić AI mądrzejszym, ludzie wykonują dziwne zadania o niskim wynagrodzeniu”.

Na przykładzie krótkich filmów wideo zrobionych w sklepie spożywczym Whole Foods Simonite podkreśla rodzaje pracy, które pomogą rozwinąć kolejną fazę uczenia maszynowego.

Prowadzi to do pytania, dlaczego wszystkie te osoby są zaangażowane w filmowanie się w krótkich i prostych filmach dokumentujących działania tak podstawowe jak poruszanie ręką lub nogą.

Odpowiedź rzuca nieco światła na to, gdzie jest uczenie maszynowe i dokąd zmierza.

„Naukowcy i przedsiębiorcy chcą, aby sztuczna inteligencja rozumiała i działała w świecie fizycznym”, pisze Simonite, wyjaśniając, dlaczego on i inni wędrują kamerami. „Stąd potrzeba, aby pracownicy odgrywali sceny w supermarketach i domach. Generują materiały instruktażowe, aby uczyć algorytmów o świecie i ludziach w nim żyjących. ”

Jak zauważy wielu ekspertów, jedne z największych granic uczenia maszynowego obejmują przetwarzanie obrazu i przetwarzanie języka naturalnego. Są to niezwykle ilościowe procedury - innymi słowy, nie ma szerokiego spektrum danych wejściowych, takich jak w „wydajnych” środowiskach rzeczywistych. Zamiast tego programy uczenia maszynowego wykorzystują dane wizualne i dźwiękowe w bardzo specyficzny sposób do budowania modeli. Dzięki przetwarzaniu obrazu wybiera funkcje z (skończonego) pola widzenia. W przypadku NLP jest to łączenie fonemów.

Wykraczanie poza te konkretne kategorie wprowadzania wiąże się z czymś, co można nazwać „luką w obrazie i mowie” - wykraczając poza takie funkcje, jak przetwarzanie obrazu i rozpoznawanie mowy, przechodzisz do obszarów, w których komputery muszą być analityczne na różne sposoby. Zestawy treningowe będą zasadniczo różne.

Wejdź do armii filmowców. W niektórych z tych nowych projektów uczenia maszynowego najmniejszymi pomysłami na ludzkie działania są zestawy szkoleniowe. Zamiast szkolić się w poszukiwaniu funkcji, krawędzi i pikseli, które składają się na zadania klasyfikacyjne, komputery zamiast tego używają filmów szkoleniowych do oceny, jak wyglądają różne rodzaje akcji.

Kluczową sprawą jest to, co inżynierowie mogą zrobić z tymi danymi, gdy są one agregowane i ładowane, a komputer jest na nich szkolony. Wkrótce zobaczysz wyniki w różnych dziedzinach - na przykład sprawi, że nadzór będzie niezwykle skuteczny. Komputery będą mogły „widzieć” w polu widzenia, co ludzie robią, i stosować to do dziedzin takich jak marketing i sprzedaż, a może, w niektórych przypadkach, praca agencji rządowej lub sądownictwo karne.

Konsekwencje rzucają również nieco światła na debatę między pytaniami dotyczącymi maksymalnych korzyści i prywatności. Wiele z wykorzystania tych filmów zbuduje modele uczenia maszynowego, które sprawdzą się w monitoringu - ale co z ludźmi, którzy nie chcą być badani? Kiedy te nowe programy uczenia maszynowego są wdrażane w przestrzeni publicznej, jakie są prawa jednostki i gdzie ta linia jest narysowana?

W każdym razie firmy używają tego rodzaju zasobów ludzkich i wideo, aby naprawdę zagłębić się w kolejne rundy postępów w uczeniu maszynowym, które pozwolą komputerom rozpoznać, co się wokół nich dzieje, zamiast klasyfikować obrazy lub pracować z fonemami przemówienie. Jest to niezwykle interesujący i kontrowersyjny rozwój sztucznej inteligencji, który zasługuje na uwagę w mediach technicznych i nie tylko.

Dlaczego niektóre projekty uczenia maszynowego mogą wymagać ogromnej liczby aktorów?