P:
W jaki sposób nowe możliwości uczenia maszynowego umożliwiają wydobywanie dokumentów giełdowych na potrzeby danych finansowych?
ZA:Jedną z ekscytujących nowych granic uczenia maszynowego i sztucznej inteligencji jest to, że naukowcy i inżynierowie podejmują różne sposoby wykorzystania zupełnie nowych rodzajów zasobów do przewidywania zmian stanów magazynowych i wyników inwestycyjnych. Jest to niesamowity przełom w świecie finansów i zrewolucjonizuje strategie inwestycyjne w bardzo głęboki sposób.
Jednym z podstawowych pomysłów na rozszerzenie tego rodzaju badań giełdowych jest lingwistyka obliczeniowa, która obejmuje modelowanie języka naturalnego. Eksperci badają, jak korzystać z dokumentów tekstowych, od dokumentów SEC do listów akcjonariuszy po inne peryferyjne zasoby tekstowe, w celu rozszerzenia lub dopracowania analizy zapasów lub opracowania całkowicie nowych analiz.
Bezpłatne pobieranie: Uczenie maszynowe i dlaczego to ma znaczenie |
Ważnym zastrzeżeniem jest to, że wszystko to jest możliwe do zrealizowania tylko dzięki nowym postępom w sieciach neuronowych, uczeniu maszynowemu i analizie języka naturalnego. Przed pojawieniem się ML / AI technologie komputerowe wykorzystywały głównie programowanie liniowe do „odczytu” danych wejściowych. Dokumenty tekstowe były zbyt niezorganizowane, aby były przydatne. Jednak wraz z postępem dokonanym w analizie języka naturalnego w ciągu ostatnich kilku lat naukowcy odkrywają, że możliwe jest „wydobycie” języka naturalnego w celu uzyskania wymiernych wyników lub, innymi słowy, wyników, które można w jakiś sposób obliczyć.
Niektóre z najlepszych dowodów i najbardziej użytecznych przykładów pochodzą z różnych rozpraw i prac doktorskich dostępnych w Internecie. W artykule „Zastosowania uczenia maszynowego i lingwistyki obliczeniowej w ekonomii finansowej”, opublikowanym w kwietniu 2016 r., Lili Gao umiejętnie wyjaśnia odpowiednie procesy specyficzne dla wyszukiwania korporacyjnych dokumentów SEC, wezwań akcjonariuszy i komunikatów w mediach społecznościowych.
„Wyodrębnianie znaczących sygnałów z nieustrukturyzowanych i wielowymiarowych danych tekstowych nie jest łatwym zadaniem”, pisze Gao. „Jednak wraz z rozwojem uczenia maszynowego i obliczeniowych technik językowych przetwarzanie i analiza statystyczna dokumentów tekstowych mogą być osiągnięte, a wiele zastosowań statystycznej analizy tekstu w naukach społecznych okazało się sukcesem”. Z dyskusji Gao na temat modelowania i kalibracji w streszczeniu, cały opracowany dokument pokazuje, w jaki sposób niektóre z tego typu analiz działają szczegółowo.
Inne źródła aktywnych projektów to strony takie jak niniejszy opis projektu GitHub oraz ten zasób IEEE mówiący konkretnie o uzyskiwaniu cennych informacji finansowych z „analizy nastrojów na Twitterze”.
Najważniejsze jest to, że zastosowanie tych nowych modeli NLP przyspiesza innowacje w stosowaniu wszelkiego rodzaju dokumentów tekstowych, nie tylko do analizy finansowej, ale także do innych odkryć, zamazując tradycyjnie ustaloną granicę między „językiem” a "dane."