Fascynująca prezentacja Kate Crawford, głównego badacza z Microsoft Research, na konferencji Strata 2013 w 2013 r. Przygląda się bliżej dużym zbiorom danych i ich znaczeniu, badając niektóre z tego, co Crawford nazywa „złudzeniami algorytmicznymi” oraz ograniczenia rozwiązań na dużą skalę danych które są uwzględniane w wielu częściach świata biznesu.
Wykorzystując fundamentalną analogię do złudzenia optycznego obracającego się kota, Crawford twierdzi, że chociaż duże zbiory danych są niezbędne w wielu aplikacjach biznesowych, istnieje więcej niż jeden sposób interpretacji wielu wyników zestawów danych, które mogą wydawać się obiektywne dla decydentów ludzkich .
„Rzeczy można postrzegać inaczej”, powiedział Crawford, cytując artykuł, w którym ona i współautor David Boyd zastanawiają się nad niektórymi głównymi zasadami korzystania z dużych zbiorów danych, w tym tym, co Crawford nazywa „mitologią”, lub przekonaniem, że duże zbiory danych przynoszą absolutną prawdę i obiektywizm projektu. Powiedziała, że liderzy często wiążą bezpośrednio duże zbiory danych z obiektywnym widokiem z lotu ptaka, ignorując to, co nazwała trzema podstawowymi ograniczeniami lub względami, które mogą wpływać na tę obiektywność na kluczowe sposoby: stronniczość, sygnał i skalę.
Począwszy od stronniczości, Crawford wykorzystuje przykłady powodzi w Australii i Stanach Zjednoczonych, aby pokazać, że duże zbiory danych nie zawsze odpowiadają rzeczywistości na ulicy. Wiąże się z drugą zasadą, sygnałem, dalej ilustrując, w jaki sposób zestawy danych mogą odzwierciedlać ukryte rzeczywistości, które mogą mocno wypaczać wyniki. Jako jeden przykład Crawford przytoczył wiele rodzajów map świata, które zostały opracowane w celu przedstawienia obiektywnego obrazu względnej wielkości kontynentów i narodów.
„Mapy nie są neutralne” - powiedział Crawford. „Dokonujemy wyborów za każdym razem, gdy decydujemy się reprezentować nasze dane”.
Aby dodatkowo zilustrować tę zasadę, Crawford wykorzystuje przykład aplikacji, która zgłasza dziury w Bostonie urzędnikom miejskim, sugerując, że tego rodzaju aplikacje działające na smartfonach i urządzeniach mobilnych mogą sprawić, że ogólne raporty będą przypominać mapy spisowe wskazujące względny wiek i dochód w mieście lub gminie.
„Grozi nam dalsze umocnienie określonych rodzajów nierówności społecznych” - powiedział Crawford, wskazując na tych, którzy mogą zostać wykluczeni z danego zbioru dużych zbiorów danych z powodu różnic w wykorzystaniu technologii.
„Co się stanie, jeśli będziesz żył w cieniu dużych zbiorów danych?” powiedziała.
Ponadto Crawford mówi także o badaniach sprzed lat, w których kwestionowano, czy informacje wysokiego poziomu zawsze reprezentują bardziej szczegółowe dane i czy „obiektywna panorama” zawsze działa jako dokładniejsza reprezentacja niż dane na mniejszą skalę. Crawford prosi również słuchaczy, aby myśleli nie tylko o dużych zbiorach danych, ale także o „danych z głębią”. Rozumie przez to dane, które naprawdę prowadzą czytelników w kierunku obiektywnej rzeczywistości, zamiast glosowania szczegółów z bardziej globalnym podejściem, które - choć łatwiejsze do zrozumienia - może pominąć kluczowe elementy tego, co faktycznie istnieje.