Drew zaprezentuje się na szczycie Big Data Innovation Summit, 30 i 31 stycznia w Las Vegas: http://analytics.theiegroup.com/bigdata-lasvegas, wraz z prelegentami z Obamy w Ameryce, Best Buy, LinkedIn, The New York Times, Nokia, Bitly, Barnes & Nobles, Walmart Labs i wiele innych.
Link rejestracyjny: http://bit.ly/Zs3wms
Ten wywiad przeprowadził George Hill i opublikował w magazynie Big Data Innovation Magazine.
Jaka była reakcja na twoje przewidywania?
Większość reakcji skupiała się na różnicy w dokładności między tymi z nas, którzy badali sondaże opinii publicznej, a przewidywaniami popularnych ekspertów i komentatorów na temat „przeczucia”. W dniu wyborów analitycy danych tacy jak ja, Nate Silver (blog New York Times FiveThirtyEight), Simon Jackman (Stanford University i Huffington Post) i Sam Wang (Princeton Election Consortium) postawili szanse Obamy na ponowną selekcję na ponad 90% i poprawnie przewidzieli 332 głosy wyborcze na Obamę jako najbardziej prawdopodobny wynik. Tymczasem eksperci, tacy jak Karl Rove, George Will i Steve Forbes, powiedzieli, że Romney wygra - aw niektórych przypadkach łatwo. Doprowadziło to do mówienia o „zwycięstwie w kwantach”, które, mam nadzieję, doprowadzą do przyszłych wyborów.
Jak oceniasz algorytm zastosowany w twoich prognozach?
Mój model prognostyczny oszacował wyniki głosowania przez państwo i ostateczne głosowanie w wyborach każdego dnia kampanii, począwszy od czerwca. Chciałem, aby ocena tych prognoz była możliwie jak najbardziej uczciwa i obiektywna - i nie pozostawiła mi żadnych wahań, jeśli się mylą. Tak więc, około miesiąc przed wyborami, zamieściłem na swojej stronie zestaw ośmiu kryteriów oceny, które zastosowałbym, gdy tylko znane byłyby wyniki. Jak się okazało, model działał idealnie. Latem przewidywał, że Obama wygra wszystkie swoje stany z 2008 r. Bez Indiany i Karoliny Północnej, i ledwo wyszedł z tej prognozy nawet po poparciu dla Obamy, który wzrósł we wrześniu, a następnie spadł po pierwszej debacie prezydenckiej.
Ilość danych wykorzystywanych w tej kampanii zarówno przez niezależnych analityków, jak i zespoły kampanii była ogromna, jakie to ma wpływ na wykorzystanie danych w 2016 r.?
Kampania z 2012 r. Dowiodła, że wieloma, różnorodnymi źródłami informacji ilościowych można zarządzać, ufać i skutecznie stosować do różnych celów. My z zewnątrz mogliśmy przewidzieć wynik wyborów z dużym wyprzedzeniem. W ramach kampanii poczyniono ogromne postępy w zakresie kierowania wyborców, śledzenia opinii, pozyskiwania funduszy i frekwencji wyborczej. Teraz, gdy wiemy, że te metody mogą działać, myślę, że nie ma powrotu. Oczekuję, że w 2016 r. Reporterzy i komentatorzy kampanii poważniej potraktują agregację ankiet. I chociaż Obama i Demokraci wydają się obecnie mieć przewagę w technologii kampanii, zdziwiłbym się, gdyby republikanie nie nadrobili zaległości.
Czy uważasz, że sukces tej kampanii opartej na danych spowodował, że menedżerowie kampanii muszą być teraz zarówno analitykiem, jak i strategiem?
Menedżerowie kampanii nie muszą być sami analitykami, ale powinni docenić, w jaki sposób dane i technologie można wykorzystać na ich korzyść. Kampanie zawsze wykorzystywały badania ankietowe do formułowania strategii i oceny nastrojów wyborców. Ale teraz dostępnych jest wiele innych potężnych narzędzi: serwisy społecznościowe, bazy danych wyborców, smartfony i marketing e-mailowy, żeby wymienić tylko kilka. Jest to dodatek do ostatnich postępów w metodologii głosowania i modelowania opinii statystycznych. Obecnie w polityce kampanii amerykańskiej dzieje się wiele innowacji.
Udało ci się przewidzieć wyniki wyborów 6 miesięcy wcześniej. Jak myślisz, jaki jest realistyczny maksymalny czas na dokładne przewidzenie wyniku przy użyciu technik analitycznych?
Około czterech lub pięciu miesięcy minęło już tak dawno, jak pozwala nam nauka; i to nawet trochę popycha. Wcześniej ankiety po prostu nie były wystarczająco informujące o ostatecznym wyniku: zbyt wiele osób jest niezdecydowanych lub nie zaczęło zwracać uwagi na kampanię. Historyczne czynniki ekonomiczne i polityczne, które okazały się korelować z wynikami wyborów, również zaczynają tracić swoją moc przewidywania, gdy przekroczymy przedział około 4-5 miesięcy. Na szczęście wciąż daje to kampaniom dużo czasu na opracowanie strategii i podjęcie decyzji dotyczących alokacji zasobów.