Dom Audio Wszędzie osadzaj analitykę: umożliwiając naukowcowi danych obywatelskich

Wszędzie osadzaj analitykę: umożliwiając naukowcowi danych obywatelskich

Anonim

Przez Techopedia Staff, 25 sierpnia 2016 r

Na wynos: Gospodarz Rebecca Józefwiak omawia fenomen osadzonych analityków i badaczy danych obywatelskich z dr. Robinem Bloorem, Dezem Blanchfieldem i Davidem Sweenorem.

Musisz zarejestrować się na to wydarzenie, aby obejrzeć wideo. Zarejestruj się, aby zobaczyć wideo.

Rebecca Jóźwiak: Panie i panowie, cześć i witamy w Hot Technologies. „Osadź wszędzie: włączanie Citizen Data Scientist” to dziś nasz temat. Wypełniam Twojego zwykłego gospodarza, to Rebecca Jozwiak zastępuje Erica Kavanagha. Tak, ten rok jest gorący. Zwłaszcza pojęcie „naukowiec danych” zyskuje wiele uwagi, mimo że zwykliśmy nazywać je nudnymi nazwami, takimi jak „statystyki” lub „ekspert analityczny”, w zasadzie zajmując się tym samym rodzajem działalności, ale ma nową seksowną nazwę i jest przyciągając dużo uwagi. Bardzo pożądane jest, aby mieć je w miejscu pracy, co jest korzystne dla organizacji i każdy tego chce. Ale są one: 1) drogie, 2) trudne do znalezienia. Wiesz, było wiele wiadomości na temat niedoboru umiejętności naukowca danych, tak, ale nadal oferują one ogromną wartość dla organizacji, a ludzie domagają się sposobu, w jaki sposób uzyskać tę wartość bez konieczności rezygnacji z pieniędzy, więc mówić.

Ale dobrą wiadomością jest to, że widzimy pojawiające się narzędzia i oprogramowanie, które rekompensują ten niedobór. Mamy automatyzację, uczenie maszynowe, wbudowaną analitykę, o czym będziemy się dzisiaj uczyć, i to w pewnym sensie dało początek temu określeniu „naukowiec danych obywatelskich” i co to oznacza? Nie, to nie jest twój wyszkolony specjalista od danych, może to być Twój użytkownik biznesowy, Twój ekspert BI, ktoś z IT, ktoś mający doświadczenie, ale niekoniecznie wiedza specjalistyczna. Ale to, co robi, te narzędzia i oprogramowanie, zapewnia większej liczbie osób dostęp do inteligentnych rozwiązań, nawet jeśli nie znają głębokiego kodowania. Ale to tylko poprawia ogólną wydajność, gdy dajesz każdemu nieco większy dostęp do tej myśli analitycznej. Nie musisz odbyć szkolenia, aby mieć ciekawość, która może prowadzić do dobrego wglądu dla Twojej firmy.

Dyskutuje o tym z nami dzisiaj nasz własny Robin Bloor, główny analityk w Bloor Group, jeden z nieuchwytnych badaczy danych, dzwoni Dez Blanchfield, a następnie mamy David Sweenor z Dell Statistica, który przedstawi nam dzisiaj prezentację. I po tym przekażę to Robin Bloor.

Robin Boor: Dobra, dzięki za wprowadzenie. Myślałem o tym trochę w kontekście historycznym. To, na co tak naprawdę patrzymy, to jeden z projektów Leonarda da Vinci na rodzaj szybowca, który człowiek mógłby umieścić na plecach. Nie mam pojęcia, czy to rzeczywiście zadziała. Muszę powiedzieć, że nie chciałbym się w to angażować. Jednak da Vinci, ilekroć myślę o da Vinci, myślę o nim jako o jednym z najbardziej dociekliwych i analitycznych ludzi, jaki kiedykolwiek istniał. I jest całkiem jasne, jeśli popatrzysz na ten szybowiec, który jest zaprojektowany na podstawie skrzydła ptaka, a on w taki czy inny sposób zbadał loty ptaków, aby je zbudować.

Jeśli spojrzymy na perspektywę historyczną - faktycznie to sprawdziłem - analityka jest prawdopodobnie najstarszym zastosowaniem matematyki. Istnieją spisy powszechne, które pochodzą przynajmniej z czasów babilońskich. Wiemy o tym, ponieważ w zasadzie niektóre tablety klinowe zawierają takie dane. Nie wiadomo, czy coś wróciło wcześniej. Ale oczywistą rzeczą jest to, że masz cywilizację z dużą populacją ludzi, tak naprawdę wymaga planowania i warto wiedzieć, co planujesz i jakie są wymagania tych ludzi.

I tak to się zaczęło, i tam też zaczęło się przetwarzanie, ponieważ wczesne komputery, wczesne komputery mechaniczne były, tak naprawdę, myślę, że pierwszym był spis ludności stworzony przez Hollerith, który, jak sądzę, stał się IBM. Wszystko to poszło do przodu. Nastąpiło coś w rodzaju przerwy między być może latami siedemdziesiątymi a współczesnością, gdzie istnieje wiele innych aplikacji i analiz, można powiedzieć, że zajęło miejsce na zapleczu. Tak, trwały analizy - działo się to w dużych organizacjach, szczególnie w bankach i towarzystwach ubezpieczeniowych, a właściwie w General Electric i telekomunikacji itp. - ale nie było to powszechnie używane w biznesie, a teraz zaczyna być używane ogólnie biznes. I to naprawdę zmieniło grę. Pierwszą rzeczą, na którą chciałem zwrócić uwagę, jest piramida danych, którą szczególnie lubię. To znaczy, narysowałem jeden z nich 20 lat temu - co najmniej 20 lat temu - aby spróbować zrozumieć, naprawdę wtedy próbowałem zrozumieć BI i niektóre z wcześniejszych eksploracji danych, które były wykonywane. Zdefiniowałem tutaj pojęcie danych, a przykładami są sygnały, pomiary, nagrania, zdarzenia, transakcje, obliczenia, agregacje, pojedyncze punkty informacji. Możesz myśleć o nich jak o cząsteczkach informacji, ale są to pojedyncze punkty. Staje się informacją, gdy tylko uzyska kontekst. Połączone dane, dane ustrukturyzowane, bazy danych, wizualizacja danych, plotery, schematy i ontologie - wszystkie one kwalifikują się w mojej opinii jako informacje, ponieważ to, co zrobiłeś, łączy wiele różnorodności i stworzyło coś więcej niż punkt danych, coś, co faktycznie ma kształt, matematyczny kształt.

Ponad tym mamy wiedzę. Możemy, badając informacje, możemy dowiedzieć się, że istnieją różne wzorce i możemy je wykorzystać, formułując reguły, zasady, wytyczne, procedury, a następnie przybiera ono formę wiedzy. I prawie wszystkie programy komputerowe, niezależnie od tego, co robią, są pewnego rodzaju wiedzą, ponieważ działają przeciwko danym i stosują wobec nich reguły. Mamy te trzy warstwy, a między warstwami jest coraz bardziej udoskonalane. A po lewej stronie tego diagramu pokazane są nowe dane, więc wiele z tych rzeczy jest statycznych. Dane kumulują się, informacje kumulują się, a wiedza potencjalnie rośnie. Na górze mamy „Zrozumienie” i utrzymałbym, chociaż jest to filozoficzny argument, że zrozumienie dotyczy tylko ludzi. Jeśli się mylę, wszyscy w pewnym momencie zostaną zastąpieni komputerami. Ale zamiast debaty przejdę do następnego slajdu.

Kiedy spojrzałem na to, ciekawą rzeczą, to jest coś świeżego, interesującą rzeczą było spróbować dowiedzieć się, czym właściwie była analityka. I w końcu, rysując różne diagramy i kończąc na takim, który wyglądał tak, doszedłem do wniosku, w rzeczywistości rozwój analityki to tak naprawdę tylko tworzenie oprogramowania z ogromną ilością formuł matematycznych. Eksploracja analityczna różni się nieco od rozwoju oprogramowania w tym sensie, że wziąłbyś wiele, wiele różnych modeli i zbadałeś je w celu wygenerowania nowej wiedzy o danych. Ale kiedy go wygenerujesz, zostanie zaimplementowany albo w czymś, co myślę o biernym wsparciu decyzyjnym, które jest informacją po prostu dostarczaną użytkownikowi; interaktywne wsparcie decyzyjne, takie jak OLAP, w którym użytkownik otrzymuje uporządkowany zestaw danych, które może zbadać i wydedukować dla siebie za pomocą różnych dostępnych narzędzi. Taka jest duża wizualizacja. A potem mamy automatyzację, jeśli możesz po prostu przekształcić zgromadzoną wiedzę analityczną w zestaw reguł, które można wdrożyć, niekoniecznie potrzebujesz człowieka do zaangażowania. W taki sposób na to spojrzałem, kiedy to wszystko zrobiłem. I zaczęły mi się dziać różne rzeczy. Kiedyś obszar działalności, powiedzmy, gdy domena danych jest faktycznie wydobywana, dokładnie wydobywana, dokładnie badana we wszystkich możliwych kierunkach, ostatecznie staje się po prostu krystalizowanym BI. Wynaleziona wiedza zaczyna się przekształcać w wiedzę, która informuje różnych użytkowników na różne sposoby i zwiększa ich, miejmy nadzieję, faktyczną pracę, którą wykonują.

Jedną z rzeczy, które zauważyłem i analizowałem analitykę predykcyjną przez około pięć lat, ale analityka predykcyjna staje się BI, w tym sensie, że staje się po prostu użyteczną informacją dla ludzi i jak już zauważyłem, istnieje automatyczne raportowanie BI, eksploracja BI, BI, bardzo różne jej gradacje, a analiza predykcyjna przebiega we wszystkich trzech kierunkach. Proces analityczny, o którym wspomniałem, nie różni się tak bardzo od tworzenia oprogramowania, wykonywanego przez różne osoby o nieco innych umiejętnościach. Przypuszczam, że powinienem podkreślić, że umiejętności potrzebne do tego, by naprawdę dobry naukowiec zajmował się danymi, latami zdobywa. Nie można ich łatwo zdobyć i niewiele osób może to zrobić, ale dzieje się tak, ponieważ wymaga to zrozumienia matematyki na bardzo wyrafinowanym poziomie, aby wiedzieć, co jest ważne, a co nie. Rozwój analityki, odkrywanie nowej wiedzy, implantacja analityki, polega na uruchomieniu wiedzy. Takie tło widzę dla całej analizy. To ogromny obszar i ma wiele, wiele wymiarów, ale myślę, że uogólnienie dotyczy wszystkiego.

Potem dochodzi do zakłóceń w działalności gospodarczej, jak już wspomniałem, istnieje wiele organizacji, inne są firmy farmaceutyczne, które mają w swoim DNA dane analityczne. Ale jest wiele organizacji, które tak naprawdę nie mają tego w swoim DNA, a teraz mają taką możliwość, teraz oprogramowanie i sprzęt są znacznie tańsze niż kiedyś, teraz mają możliwość ich wykorzystania. Powiedziałbym wiele rzeczy. Pierwszą rzeczą jest to, że analityka to w wielu przypadkach badania i rozwój. Być może po prostu stosujesz analitykę w określonym obszarze organizacji i może wydawać się przyziemne, że w taki czy inny sposób analizujesz zamówienia klientów po raz kolejny z różnych perspektyw, łącząc je z innymi danymi. Ale analityka w rzeczywistości stwarza możliwość spojrzenia na organizację jako całość i niemal do analizy każdego konkretnego działania, które dzieje się w organizacji i całych łańcuchów działań. Ale kiedy faktycznie przeprowadzisz się do tego obszaru, utrzymam, że są to badania i rozwój. Pytanie, które zadałem mi kilka razy, brzmi: „Ile firma powinna wydać na analitykę?”. I myślę, że najlepszym sposobem myślenia o udzieleniu odpowiedzi jest myślenie o analizie jako badaniach i rozwoju i po prostu zapytaj: „Ile byś wydał na badania i rozwój w zakresie wydajności firmy?”

A firmy, które nie są analityczne, jest wiele rzeczy, których nie znają. Przede wszystkim nie wiedzą, jak to zrobić. Zwykle, jeśli faktycznie przechodzą w taki czy inny sposób, korzystając z analityki w organizacji - tak naprawdę nie mają innego wyjścia, jak pójść do firmy doradczej, która może im w tym pomóc, ponieważ byłoby to niemożliwe lub bardzo trudne dla większości firmy, które faktycznie zatrudnią naukowca danych, znajdując go, płacąc za niego i ufając, że zrobią to, co chcesz. Bardzo trudne. Większość firm nie wie, jak zatrudnić lub edukować pracowników, aby faktycznie wykonywali tę pracę, a powodem tego jest to, że po prostu nie ma ich w DNA, więc nie jest częścią ich naturalnych procesów biznesowych. To powoduje przejście do następnego punktu. Nie wiedzą, jak zrobić z tego proces biznesowy. Nawiasem mówiąc, najlepszym sposobem na to jest skopiowanie tego, co firmy farmaceutyczne i firmy ubezpieczeniowe, po prostu spójrz, a niektóre firmy w centrum opieki zdrowotnej, po prostu spójrz na sposób, w jaki korzystają z analiz i skopiuj je. Ponieważ jest to proces biznesowy. Nie wiem, jak go nadzorować ani kontrolować. To naprawdę, szczególnie teraz, gdy okropna liczba firm tworzących oprogramowanie stworzyła produkty, które automatyzują ogromną liczbę analiz. Punkt dotyczący audytu jest ważny, gdy masz firmę konsultingową lub kogoś na miejscu, któremu można zaufać, aby zrozumieć, jakie są wyniki obliczeń analitycznych, jest to wybór, którego musisz dokonać, ale jeśli umieścisz naprawdę potężne narzędzia analityczne w ręce ludzi, którzy nie rozumieją właściwie analiz, mogą wyciągać wnioski, które mogą być niepoprawne. I jak powiedziałem, firmy nie wiedzą, jak na to budżetować.

To są smaki analityczne, po prostu je przejrzę. Analityka statystyczna i modelowanie statystyczne znacznie różnią się od analityki predykcyjnej, która, nawiasem mówiąc, jest dopasowana do krzywej. Uczenie maszynowe różni się od tych rzeczy, analizy ścieżek i szeregi czasowe, które zasadniczo są wykonywane w strumieniach statusu, znów są różne. Analiza wykresów znów jest inna, a analizy tekstu i analizy semantyczne znów się różnią. To tylko wskazuje, że jest to bardzo wielogatunkowa sprawa. Nie chodzi o to, że nie zaczynasz robić analiz, zaczynasz patrzeć na problemy, które masz, i szukasz różnych narzędzi i różnych smaków analiz, które im odpowiadają. I wreszcie sieć netto. Ze względu na ewolucję sprzętu i oprogramowania, moim zdaniem, analiza jest w powijakach. Przed nami jeszcze wiele, wiele więcej i zobaczymy, jak to będzie wyglądać w nadchodzących latach. Myślę, że mogę teraz podać piłkę Dezowi.

Dez Blanchfield: Tak, porozmawiaj o trudnym akcie do naśladowania, Robin. Zamierzam krótko przejść do tego tematu pod jednym z moich ulubionych kątów, którym jest człowiek. W naszym codziennym życiu zachodzi wiele zmian. Moim zdaniem jednym z największych zakłóceń w naszym codziennym życiu jest po prostu codzienna praca. Pojawienie się w pracy i próba wykonania pracy, do której jesteś zatrudniony, oraz rosnące oczekiwania, że ​​zmienisz się z codziennej osoby w superbohatera, oraz ilość informacji, które przepływają wokół organizacji i emitują bardzo, bardzo szybko, jest to znaczące wyzwanie i coraz bardziej musimy dostarczać ludziom coraz lepsze narzędzia, aby próbowali poradzić sobie z przepływem wiedzy i informacji, dlatego pomyślałem, że spróbuję to zrobić z nieco zabawnego punktu widzenia . Ale zawsze uderza mnie to, jak mamy takie umysły lub flash moby i tak dalej, które w pewnym sensie prowadzą nas do tego, o czym mówimy jako analizy, ale tak naprawdę to, o czym mówimy, udostępnia informacje ludziom, i pozwalając im na interakcję i robienie tego w taki sposób, aby było to naturalne i wydawało się normalne.

I w rzeczywistości przypomina mi film na YouTube z małym dzieckiem, małym dzieckiem, siedzącym na podłodze i siedzącym tam, bawiącym się iPadem, który trzepocze i ściska, ściska i przesuwa obrazy oraz bawi się ekranem, dane tam. A potem rodzic zabiera iPada i kładzie czasopismo, magazyn drukowany na kolanach dziecka. A to dziecko prawdopodobnie nie ma więcej niż dwa lata. Dziecko zaczyna próbować przesuwać palcem po ekranie magazynu, szczypać i ściskać, a magazyn nie reaguje. Dziecko podnosi palec, patrzy na niego i myśli: „Hmm, nie sądzę, że mój palec działa”, a on wsuwa się w ramię i myśli: „Ach nie, mój palec działa, czuję rękę i to wygląda dobrze ”i wije się w palcu, a palec wije się i reaguje. Tak. Następnie próbuje ponownie wejść w interakcję z magazynkiem i nisko, a nie chwyta, nie ściska i nie przewija. Potem zabierają magazynek i kładą iPada z powrotem na kolana i nagle wszystko działa. Oto dziecko, które przyszło i zostało przeszkolone do korzystania z narzędzia analitycznego lub narzędzia do przesyłania strumieniowego na żywo w celach rozrywkowych i nie może zrozumieć, jak powinien działać magazyn i jak przewracać strony.

I to jest interesująca koncepcja sama w sobie. Ale kiedy myślę o wiedzy przepływającej przez organizacje oraz o sposobie przepływu danych i zachowaniu ludzi, często myślę o tej koncepcji tego, co ludzie nauczyli się być flash mobem, co jest wydarzeniem, gdzie i jakie media społecznościowe to jeszcze łatwiejsze do zrobienia, jako taki pomysł, który trafia do tego miejsca o tej godzinie i dacie i akcji, lub wideo i uczyć się tych tańców, lub nosić ten kolorowy kapelusz i wskazywać na północ o pierwszej. Wypychasz to przez swoją sieć i niezmiennie cały ładunek ludzi, setki z nich, pojawia się w tym samym miejscu w tym samym czasie, robi to samo i jest ten czynnik wow, taki jak „Święta krowa, to było naprawdę imponujące! ”Ale w rzeczywistości jest to naprawdę prosty pomysł i prosta koncepcja jest po prostu wypychana przez nasze sieci i otrzymujemy ten wynik, który jest oszałamiający wizualnie i słyszalnie imponujący. A kiedy myślisz o organizacji, sposobie, w jaki chcemy, aby ludzie się zachowywali, i tym, jak chcemy, aby radzili sobie z systemami informatycznymi i klientami, często jest to takie proste, to pomysł lub koncepcja lub cecha kulturowa lub behawioralna, którą staramy się przekazać za pomocą narzędzi i informacji oraz wzmocnić ich pozycję.

U podstaw tego wszystkiego leży ta mantra, którą mam od ponad dwóch i pół dekady, a mianowicie, jeśli twoi pracownicy nie mogą znaleźć tego, czego potrzebują do wykonania swojej pracy, czy to narzędzi, czy informacji, niezmiennie wymyślą nowe koło. A zatem jest to wciąż rosnące wyzwanie, w którym mamy dużą wiedzę, mnóstwo informacji i rzeczy poruszających się bardzo szybko, że chcemy zatrzymać ludzi na nowo wymyślając koło. A kiedy myślimy o naszym środowisku pracy, wracając do punktu widzenia ludzi, który jest jednym z moich ulubionych, byłem zaskoczony, gdy zdziwiłem się, że kabiny nie są sprzyjającym środowiskiem dla dobrych wyników lub ustawiliśmy takie rzeczy w ten przerażający sposób. zdjęcia tutaj i niewiele się zmieniło, po prostu opuściłem ściany i nazwał je otwartymi przestrzeniami roboczymi. Ale w środku z żółtą pętlą wokół nich są dwie osoby wymieniające się wiedzą. A jednak, jeśli spojrzysz na resztę pokoju, wszyscy siedzą tam posłusznie, waląc, i umieszczając informacje na ekranie. I częściej niż nie, tak naprawdę wymiana wiedzy i danych, i jest wiele powodów. Ale interakcja na środku podłogi po lewej stronie w żółtym kółku, dwie osoby czatują tam, wymieniają się wiedzą i prawdopodobnie próbują coś znaleźć, próbując powiedzieć: „Czy wiesz, gdzie jest ten raport, gdzie ja mogę znaleźć te dane, jakiego narzędzia używam do zrobienia tego? ”I prawdopodobnie to nie zadziałało, więc nie mają nic, i wędrowały po podłodze, złamały zasadę przestrzeni biurowej i zrobiły to osobiście.

Mieliśmy podobne środowiska w biurze, w których żartujemy sobie z żartów, ale w rzeczywistości są dość potężne i skuteczne. Jedną z moich ulubionych jest mobilna lub stała platforma analityczna o nazwie cooler wody, w której ludzie wchodzą na górę i rozmawiają, wymieniają się wiedzą, porównują pomysły i przeprowadzają analizy, stojąc przy coolerrze i wymieniając pomysły. Są to bardzo potężne koncepcje, kiedy o nich pomyślisz. A jeśli potrafisz je przetłumaczyć na swoje systemy i narzędzia, masz niesamowity wynik. I mamy ulubionego przez cały czas, który jest w istocie najpotężniejszym centrum dystrybucji danych w biurze, znanym również jako recepcja. A jeśli nie możesz czegoś znaleźć, gdzie idziesz? Cóż, idziesz do biura i idziesz do recepcji i mówisz: „Czy wiesz, gdzie jest x, y, z?”. I odważę się powiedzieć, że nie zrobili tego przynajmniej raz w nowym praca lub w pewnym momencie, kiedy po prostu nie mogą czegoś znaleźć. I musisz zadać sobie pytanie, dlaczego tak jest? Powinien być gdzieś w intranecie, na jakimś narzędziu lub czymkolwiek. Powinno być łatwe do znalezienia.

Dlatego jeśli chodzi o dane i analizy oraz narzędzia, które zapewniamy naszym pracownikom do wykonywania ich zadań oraz sposób, w jaki ludzie wchodzą w interakcje z zadaniami, mam pogląd, że przed ostatnim pojawieniem się narzędzi analitycznych i platform dużych zbiorów danych, lub też „przetwarzanie danych”, jak to nazywają w starej szkole, raportowanie i dzielenie się wiedzą dalekie były od dynamiki, współpracy lub otwartości, a kiedy myślisz o rodzaju systemów, z którymi oczekujemy, że ludzie będą wykonywać swoją pracę, mieliśmy klasyczne, z czym ludzie nazywają teraz spuściznę, ale w rzeczywistości jest to tylko dziedzictwo, które się pojawiło i nadal istnieje, dlatego też nie jest tak naprawdę dziedzictwem. Ale tradycyjne systemy HR i systemy ERP - zarządzanie zasobami ludzkimi, planowanie zasobów przedsiębiorstwa, zarządzanie danymi przedsiębiorstwa oraz systemy, których używamy do zarządzania informacjami w celu prowadzenia firmy. Niezmiennie jest wyciszony. A z najwyższej półki, proste platformy, takie jak intranet departamentalny, próbują komunikować się, gdzie są rzeczy i jak je zdobyć oraz jak współdziałać z wiedzą w miejscu. Wyskakujemy w naszym intranecie. Jest tak dobry, jak ludzie, którzy poświęcają czas i wysiłek, aby go tam postawić, w przeciwnym razie po prostu pozostanie w twojej głowie. Albo masz dane na samym końcu łańcucha pokarmowego, w korporacyjnych sieciach SAN i wszystkim pomiędzy nimi, więc sieci pamięci masowej są pełne plików i danych, ale kto wie, gdzie je znaleźć.

Najczęściej budowaliśmy te zamknięte platformy danych lub zamknięte systemy, więc ludzie powrócili do takich arkuszy kalkulacyjnych i PowerPoint, aby przekazywać informacje w dowolnym miejscu. Ale myślę, że ostatnio wydarzyła się interesująca rzecz, a mianowicie, że urządzenia mobilne i Internet ogólnie działają w taki sposób, że wszystko może być lepsze. I przede wszystkim w przestrzeni konsumenckiej. Co ciekawe, w codziennym życiu zaczęliśmy mieć bankowość internetową. Nie musieliśmy fizycznie chodzić do jakiegoś banku, aby wejść z nimi w interakcję, moglibyśmy to zrobić telefonicznie. Początkowo było niezgrabnie, ale potem pojawił się internet i mieliśmy stronę internetową. Wiesz i ile razy byłeś ostatnio w swoim banku? Właściwie nie mogę, rozmawiałem o tym pewnego dnia i właściwie nie pamiętam, kiedy ostatni raz poszedłem do mojego banku, co mnie zaskoczyło. Myślałem, że muszę to sobie przypomnieć, ale to trwało tak długo temu właściwie nie pamiętam kiedy tam pojechałem. I tak teraz mamy te gadżety w postaci telefonów komórkowych, telefonów, tabletów i laptopów, mamy sieci i dostęp do narzędzi i systemów, a także przestrzeń konsumencką nauczyliśmy się, że może być lepiej, ale ponieważ z powodu szybkiej zmiany przestrzeni konsumenckiej, która była bardziej letargiczna i lodowcowa w przedsiębiorstwach i środowiskach, nie zawsze przejmowaliśmy tę zmianę w codziennym życiu zawodowym.

Uwielbiam wyśmiewać się z faktu, że nie można przesyłać strumieniowo danych na żywo. Na tym zdjęciu jest osoba siedząca, patrząc na przeprowadzone analizy, i jest piękny wykres, który został stworzony przez kogoś, kto prawdopodobnie otrzymuje dużo pieniędzy jako statystyk lub aktuariusz, i siedzą tam, próbując analityka na egzemplarzu papierowym i szturchanie go. Ale dla mnie jest to przerażające: na przykład ci ludzie w tym pokoju konferencyjnym, i wykorzystam to jako przykład, że wchodzą w interakcję z danymi, które są teraz historyczne. I jest tak stary od momentu, kiedy ten przedmiot został wyprodukowany, a następnie wydrukowany, więc może to jest tygodniowy raport. Teraz podejmują decyzje dotyczące nie tyle złych danych, ale starych danych, które niezmiennie mogą być złymi danymi. Dzisiaj podejmują decyzję w oparciu o coś historycznego, co jest naprawdę złym miejscem. Udało nam się zastąpić tę drukowaną wersją tabletów i telefonów, ponieważ pracowaliśmy bardzo szybko w przestrzeni konsumenckiej, a teraz wypracowaliśmy ją w przestrzeni korporacyjnej, że wgląd w czasie rzeczywistym jest wartością w czasie rzeczywistym.

I stajemy się coraz lepsi. I doprowadza mnie do tego, co Robin poruszył wcześniej, że była to koncepcja naukowca danych obywatelskich i motyw tej koncepcji. Dla mnie naukowiec danych obywatelskich to zwykli ludzie z odpowiednimi narzędziami i informacjami na temat iPada. Nie muszą robić matematyki, nie muszą znać algorytmów, nie muszą wiedzieć, jak stosować algorytmy i dane reguł, muszą tylko wiedzieć, jak korzystać z interfejsu. I to sprowadza mnie z powrotem do mojego wprowadzenia i koncepcji malucha siedzącego tam z iPadem kontra magazyn, w porównaniu z iPadem. Maluch może bardzo szybko, intuicyjnie nauczyć się, jak korzystać z interfejsu iPada, aby nurkować w informacjach i wchodzić z nimi w interakcję, chociaż może w grze lub multimediach strumieniowych lub wideo. Ale nie mógł uzyskać takiej samej odpowiedzi ani interakcji z paska magazynu i po prostu flashowania strona po stronie, co nie jest zbyt angażujące, szczególnie jeśli jesteś małym dzieckiem, które dorastało na iPadzie. Niezmiennie ludzie mogą bardzo szybko patrzeć i uczyć się, jak prowadzić narzędzia i rzeczy, które po prostu im zapewniamy, a jeśli zapewnimy im interfejs, taki jak urządzenia mobilne, a zwłaszcza tablety i smartfony, z wystarczająco dużymi ekranami, a zwłaszcza, jeśli możesz współdziałać w dotyku, palcami, nagle pojawia się koncepcja naukowca zajmującego się danymi obywatelskimi.

Ktoś, kto może zastosować analizę danych za pomocą odpowiednich narzędzi, ale bez faktycznej wiedzy, jak to zrobić. Moim zdaniem wiele z nich, jak powiedziałem, było pod wpływem wpływów konsumentów, które przeniosły się i przekształciły w popyt i przedsiębiorczość. Kilka naprawdę szybkich przykładów. My, wielu z nas, zaczęliśmy robić rzeczy z naszymi blogami i stronami internetowymi, na przykład umieszczać małe reklamy lub patrzeć na śledzenie i ruch, korzystaliśmy z narzędzi takich jak Google Analytics i obudziliśmy się, że na naszych blogach i małych stronach internetowych, moglibyśmy umieścić tam małe fragmenty kodu, a Google dałby nam wgląd w czasie rzeczywistym, kto odwiedza witrynę, kiedy, gdzie i jak. W czasie rzeczywistym mogliśmy zobaczyć, jak ludzie odwiedzają witrynę, przeglądają strony, a następnie znikają. I to było dość zadziwiające. Uwielbiam to robić, kiedy próbuję wyjaśnić analitykom w czasie rzeczywistym osoby, głupię to, pokazując im stronę internetową z podłączonym Google Analytics, i faktycznie widzę interakcję na żywo z ludźmi odwiedzającymi witryny i pytam: „Wyobraź sobie, że masz wgląd w swój biznes w czasie rzeczywistym. ”

Weźmy przykład handlu detalicznego, a może farmaceutyk, myślę, że nazywacie go apteką w Ameryce, apteką, w której wchodzisz i kupujesz wszystko, od tabletek na ból głowy po krem ​​przeciwsłoneczny i czapki. Próba prowadzenia tej organizacji bez informacji w czasie rzeczywistym to przerażająca koncepcja, teraz wiemy, co wiemy. Na przykład możesz zmierzyć ruch pieszy, możesz umieścić urządzenia w sklepie z uśmiechniętą twarzą po jednej stronie ekranu, ponieważ jesteś szczęśliwy, i nieszczęśliwą czerwienią po prawej stronie, a kilkoma różnymi odcieniami na środku. Istnieje też platforma o nazwie „Happy or Not”, w której wchodzisz do sklepu i możesz posuwać radosną lub smutną twarz, w zależności od opinii klientów na żywo. I to może być interaktywne w czasie rzeczywistym. Możesz uzyskać ceny zależne od popytu na żywo. Jeśli jest tam dużo ludzi, możesz nieco podnieść ceny, możesz zrobić dostępność zapasów i powiedzieć ludziom, na przykład - linie lotnicze, na przykład, poinformują ludzi, ile miejsc jest teraz dostępnych na stronie, kiedy rezerwujesz lot, nie tylko wybierasz losowo numer telefonu i masz nadzieję, że uda Ci się zjawić i dostać lot. Dane HR na żywo pozwalają określić, kiedy ludzie włączają się i wyłączają. Zaopatrzenie, jeśli zajmujesz się zaopatrzeniem i masz bieżące dane, możesz robić rzeczy, takie jak czekać godzinę i zabezpieczyć się przed ceną dolara amerykańskiego, aby kupić następny ładunek zapasów i mieć mnóstwo rzeczy.

Kiedy pokazuję ludziom Google Analytics i przekazuję taką anegdotę, ten moment eureki, ten moment „a-ha!”, Ta żarówka gaśnie w ich myślach: „Hmm, widzę wiele miejsc, w których mógłbym to zrobić . Gdybym tylko miał narzędzia i gdybym miał dostęp do tej wiedzy. ”Widzimy to teraz w mediach społecznościowych. Każdy, kto jest doświadczonym użytkownikiem mediów społecznościowych, innym niż tylko pokazywanie zdjęć ze swojego śniadania, ma tendencję do patrzenia na to, ile osób lubi i jaki ruch uzyskują oraz ilu znajomych, i robi to z jak np. Twitter jako narzędzie analityczne. Możesz przejść do Twitter.com, aby skorzystać z tego narzędzia, ale wpisujesz w Google Twitter Analytics kropka com, lub kliknij prawy górny przycisk, rozwijając menu i zrób to, otrzymujesz ładne wykresy na żywo, które pokazują, ile tweety robisz sam i ile interakcji z nimi. I analizy w czasie rzeczywistym tylko w osobistych mediach społecznościowych. Wyobraź sobie, że mamy takie usługi jak Google Analytics, Facebook, LinkedIn i Twitter, statystyki eBay zbliżają się do ciebie, ale w twoim środowisku pracy.

Teraz mamy na wyciągnięcie ręki internetową i mobilną transmisję na żywo, która staje się koncepcją mocy. I w ten sposób dochodzę do wniosku, i zawsze stwierdziłem, że organizacje, które wcześnie wykorzystują narzędzia i technologie, zyskują tak znaczącą przewagę nad konkurentami, że konkurenci nigdy nie mogą ich dogonić. Widzimy to teraz wraz z konfliktem naukowców zajmujących się danymi obywatelskimi. Jeśli możemy zabrać ludzi z umiejętnościami, wiedzą, do której ich zatrudniliśmy, i możemy dać im odpowiednie narzędzia, w szczególności możliwość przeglądania danych w czasie rzeczywistym i odkrywania danych oraz wiedzieć, gdzie to jest, bez konieczności chodzenia po kabinach i zadawać pytania na głos, gdy trzeba iść i stanąć przy chłodziarce, aby przeprowadzić analizy porównawcze z ludźmi lub pójść i zapytać recepcję, gdzie jest indeks. Jeśli potrafią to zrobić na wyciągnięcie ręki i zabrać to ze sobą na spotkanie i posiedzieć w sali konferencyjnej, przeglądając ekrany w czasie rzeczywistym, a nie drukować, nagle sprawiliśmy, że nasz personel, który nie musi być rzeczywisty naukowcy zajmujący się danymi, ale w rzeczywistości wykorzystujący analizę danych i zapewniający niesamowite rezultaty dla organizacji. I myślę, że ten punkt zwrotny, który właśnie minęliśmy, w którym konsument jest kierowany do przedsiębiorstwa, wyzwanie polega na tym, w jaki sposób zapewniamy to przedsiębiorstwo, i myślę, że to temat przewodni dzisiejszej dyskusji. I z tym zamierzam zakończyć mój utwór i przekazać go, aby dowiedzieć się, jak możemy to rozwiązać. David, do ciebie.

David Sweenor: Dobra, dziękuję bardzo chłopaki i dziękuję Robin. Robin, zgadzam się z twoją pierwotną oceną. Proces analityczny, tak naprawdę nie różni się niczym od tworzenia oprogramowania. Myślę, że wyzwanie w organizacji jest po prostu naprawdę, może rzeczy nie są tak dobrze zdefiniowane, może jest to element eksploracyjny i element kreatywny. I Dez, wiesz, zgadzam się z tobą, jest wiele odkrywania koła i wiesz, że nie ma organizacji, w którą dziś wchodzę, pytasz, cóż, dlaczego robisz to w ten sposób? Dlaczego firma działa w ten sposób? Łatwo jest zadawać pytania, a wiele razy, gdy jesteś w organizacji, trudno to zmienić. Uwielbiam analogię, konsumpcję rzeczy. I tak już nie, kiedy jadę na lotnisko i chcę zmienić miejsce - robię to na telefonie komórkowym. Nie muszę iść do agenta na stoisku i patrzeć, jak agent wpisuje coś na monochromatycznym monitorze przez 15 minut, aby zmienić przypisane mi miejsce. Po prostu wolę to robić na telefonie, więc jest to interesująca zmiana.

Dzisiaj porozmawiamy trochę o zbiorowej inteligencji. Dla tych, którzy nie są świadomi, Statistica jest wiodącą platformą analityczną, która istnieje od ponad 30 lat. Jeśli spojrzysz na którąkolwiek z publikacji w branży analityków, zawsze okaże się ona jednym z najbardziej intuicyjnych i łatwych w użyciu zaawansowanych programów analitycznych. Przez ostatnie kilka lat pracowaliśmy nad koncepcją zwaną kolektywną inteligencją i przenosimy ją na wyższy poziom. Chciałem rozpocząć tę rozmowę od: w jaki sposób praca jest wykonywana w Twojej organizacji?

I tutaj są dwa obrazy. Ten po lewej to zdjęcie z lat 60. i nie rozpocząłem kariery w latach 60., ale obraz po prawej to - to jest fabryka półprzewodników, w której zacząłem pracować. I pracowałem w tym czarnym budynku, czarny dach w lewym górnym rogu. Ale zrobili półprzewodniki. To jest ostatnie zdjęcie z Google Images. Ale kiedy wrócisz do obrazu z lat 60. po lewej, jest to bardzo interesujące. Ci ludzie siedzą w szeregu, a oni tworzą, wiesz, układy scalone i półprzewodniki. Ale istnieje standaryzacja, jest standardowy sposób robienia rzeczy i był dobrze zdefiniowany proces. Być może, ponieważ wszyscy ci ludzie siedzą w otwartym środowisku, może była jakaś współpraca. Myślę, że straciliśmy trochę tego w ramach siły roboczej wiedzy.

Kiedy usiadłem w tym budynku w lewym górnym rogu, jeśli chciałem z kimś współpracować, nie było otwarte. Były te biura, być może część ekipy była oddalona, ​​a może musiałem wędrować przez ten kampus; to był 25-minutowy spacer i musiałbym porozmawiać z kimś w budynku po prawej stronie. Myślę, że po drodze coś zgubiliśmy. A więc, wiesz, miałem tę samą myśl, dlaczego ludzie - ilu ludzi ciągle wymyśla koło w twojej organizacji? Myślę, że wiesz, organizacje jako całość wykonały dobrą robotę w latach 90. i 2000. w zakresie CRM i hurtowni danych oraz w pewnym stopniu BI. Z jakiegoś powodu dane analityczne są nieco opóźnione. Poczyniono znaczne inwestycje w hurtownię danych, standaryzację i normalizację danych, a także w CRM, ale z jakiegoś powodu analizy są opóźnione. I zastanawiam się dlaczego. Może jest kreatywna - może twój proces nie jest dobrze zdefiniowany, może nie wiesz, jaką decyzję lub dźwignię próbujesz zmienić, wiesz, w swojej firmie, aby coś zmienić. Kiedy wchodzimy dzisiaj do organizacji, wiele osób robi rzeczy bardzo ręcznie w arkuszach kalkulacyjnych.

I wiesz, spojrzałem dziś rano na statystyki, myślę, że 80, 90 procent arkuszy kalkulacyjnych ma błędy, a niektóre z nich mogą być bardzo znaczące. Podobnie jak w Whale, gdzie JPMorgan Chase stracił miliardy dolarów z powodu błędów w arkuszu kalkulacyjnym. Myślę, że mam przesłankę, że musi być lepszy sposób na załatwienie sprawy. Jak już wspomnieliśmy, mamy tych naukowców zajmujących się danymi. Ci faceci są kosztowni i trudno je znaleźć. A czasem są trochę dziwną kaczką. Ale myślę, że gdybym musiał podsumować, czym jest specjalista od danych, prawdopodobnie jest to ktoś, kto rozumie dane. Myślę, że to ktoś, kto rozumie matematykę, ktoś, kto rozumie problem. I naprawdę ktoś, kto może przekazać wyniki. A jeśli jesteś naukowcem danych, w tej chwili masz szczęście, ponieważ Twoja pensja prawdopodobnie podwoiła się w ciągu ostatnich kilku lat.

Ale prawdę mówiąc, wiele organizacji nie ma tych naukowców danych, ale twoja organizacja ma inteligentnych ludzi. Masz organizację, masz wielu inteligentnych ludzi, którzy używają arkuszy kalkulacyjnych. Wiesz, statystyki i matematyka nie są ich podstawową pracą, ale wykorzystują dane do napędzania firmy. Naprawdę, wyzwaniem, którym się zajmujemy, jest to, w jaki sposób podejmujesz się, jeśli masz szczęście, że masz naukowca danych lub statystę lub dwóch, jak możesz je podjąć i jak poprawić współpracę między tymi ludźmi a inne osoby w twojej organizacji? Jeśli spojrzymy na strukturę naszej organizacji, zacznę i będę przechodzić od prawej do lewej. Wiem, że jest to wstecz, ale mamy tę linię użytkowników biznesowych.

Jest to większość populacji pracowników wiedzy, a dla tych ludzi musisz osadzić analizy w swojej linii aplikacji biznesowych. Być może widzą wyniki analityczne na ekranie centrum telefonicznego lub coś w tym rodzaju, co oznacza, że ​​jest to kolejna najlepsza oferta dla klienta. Być może jest to konsument lub dostawca w portalu internetowym i natychmiast przyznaje im kredyt lub coś w tym rodzaju. Ale pomysł jest taki, że zużywają analizy. Jeśli przejdziemy do środka, są to pracownicy wiedzy. Są to ludzie, którzy robią dziś rzeczy z arkuszami kalkulacyjnymi, ale arkusze kalkulacyjne są podatne na błędy iw pewnym momencie zabrakło im gazu. Ci naukowcy danych o obywatelach, jak je nazywamy, wiesz, to, co próbujemy dla nich zrobić, to naprawdę zwiększyć poziom automatyzacji.

Słyszysz z analityką, że od 80 do 90 procent pracy zajmuje się przygotowaniem danych i nie jest to rzeczywista matematyka, ale przygotowanie danych. Staramy się to zautomatyzować, niezależnie od tego, czy to robisz, a my mamy kreatory i szablony oraz elementy wielokrotnego użytku, a tak naprawdę nie musisz mieć wiedzy na temat podstawowej infrastruktury w swoim środowisku. A jeśli spojrzymy na skrajnie lewą stronę, mamy tych naukowców zajmujących się danymi. I jak wspomniałem, brakuje ich. A my staramy się, aby były bardziej produktywne, pozwalają im tworzyć rzeczy, które mogą zrobić naukowcy zajmujący się danymi obywatelskimi. Pomyśl o tym jak o klockach Lego, aby ci naukowcy danych mogli stworzyć zasób wielokrotnego użytku, z którego mógłby skorzystać obywatelski naukowiec. Zbuduj go raz, abyśmy nie musieli wymyślać koła na nowo.

A także, ci faceci mogą się martwić, czy możemy robić rzeczy w bazie danych i wykorzystać istniejące inwestycje technologiczne, które poczyniła twoja firma. Wiesz, w dzisiejszych czasach nie ma sensu tasować danych tam iz powrotem na całym świecie. Więc jeśli spojrzymy na Statisticę, jak wspomniałem, jest to platforma, która istnieje już od dłuższego czasu. I jest to bardzo innowacyjny produkt. Mieszanie danych, nie było źródła danych, do którego nie moglibyśmy uzyskać dostępu. Mamy wszystkie elementy do wyszukiwania i wizualizacji danych, których można się spodziewać; możemy to zrobić w czasie rzeczywistym. I prawdopodobnie tak jest - myślę, że w narzędziu programowym znajduje się ponad 16 000 funkcji analitycznych, więc to więcej matematyki, niż kiedykolwiek mogłem użyć lub zrozumieć, ale jest tam, jeśli jej potrzebujesz.

Mamy możliwość łączenia zarówno reguł biznesowych, jak i analitycznych przepływów pracy, aby naprawdę podjąć decyzję biznesową. Wykraczasz poza zwykły, oto algorytm, oto przepływ pracy, ale masz reguły biznesowe, z którymi zawsze masz do czynienia. Jesteśmy bardzo bezpieczni w zarządzaniu. Jesteśmy wykorzystywani przez wielu klientów farmaceutycznych, ponieważ FDA nam ufa. Wiesz, po prostu udowodnij w puddingu, że mamy kontrole i możliwości audytu, które mogą zostać przez nich zaakceptowane. I na koniec, wiesz, jesteśmy otwarci, elastyczni i rozszerzani, więc musisz stworzyć platformę, która polega na tym, że chcesz, aby twoi naukowcy byli wydajni, chcesz, aby twoi obywatele - naukowcy - byli produktywni, chcesz być w stanie wdrożyć te wyniki analityczne wśród pracowników w organizacji.

Jeśli spojrzymy na to, oto przykład niektórych wizualizacji. Ale będąc w stanie dystrybuować swoje wyniki analityczne wśród użytkowników biznesowych, więc pierwszym przykładem po lewej jest diagram analityczny sieci. Być może jesteś śledczym w sprawie oszustw i nie wiesz, jak te połączenia są tworzone, a mogą to być ludzie, mogą to być podmioty, mogą to być kontrakty, cokolwiek naprawdę. Ale możesz manipulować tym za pomocą myszy i wchodzić z nim w interakcje, aby naprawdę zrozumieć - jeśli jesteś śledczym w sprawie oszustw, aby zrozumieć listę osób, dla których należy przeprowadzić dochodzenie, prawda, ponieważ nie możesz rozmawiać ze wszystkimi, więc masz spriorytetyzować.

Jeśli spojrzymy na zdjęcie po prawej stronie, dla deski rozdzielczej konserwacji predykcyjnej jest to naprawdę interesujący problem. Być może jesteś właścicielem lotniska i masz tam te skanery ciała. Te skanery ciała, jeśli jedziesz na lotnisko, jest tam kilka elementów, które mają około dziewięciomiesięczny okres trwałości. A te rzeczy są naprawdę, bardzo drogie. Jeśli mam wiele punktów wejścia, wiele skanerów na moim lotnisku, numer jeden Chcę upewnić się, że jestem odpowiednio obsadzony przy każdej bramie, a dla części znajdujących się w skanerach nie chcę ich też zamawiać wcześnie i chcę je mieć, zanim się zepsuje. Mamy możliwość, być może, jeśli jesteś właścicielem lotniska, przewidzieć, kiedy te rzeczy się zepsują i przewidzieć poziom zatrudnienia.

Jeśli spojrzymy na prawy dolny róg, dzieje się tak, jeśli jesteś w środowisku produkcyjnym, to tylko graficzna reprezentacja przepływu produkcji. I jest to trochę trudne do zobaczenia, ale na różnych sektorach procesowych są czerwone i zielone światła, więc jeśli jestem inżynierem, mamy do czynienia z bardzo zaawansowaną matematyką, ale mogę zagłębić się w ten konkretny sektor procesu i spojrzeć na parametry i dane wejściowe, które mogą powodować, że wymkną się spod kontroli. Jeśli spojrzymy na naszego naukowca zajmującego się danymi o obywatelach, naszym celem jest naprawdę ułatwienie tego naukowcowi. Mamy kreatory i szablony, a jedną rzeczą, która moim zdaniem jest naprawdę interesująca, jest ten węzeł automatycznego sprawdzania kondycji danych. I tak naprawdę to ma wbudowane inteligentne urządzenia.

Wspomniałem o przygotowaniu danych - zajmuje to dużo czasu, zarówno w zakresie agregacji danych, jak i ich przygotowania. Ale załóżmy, że mam moje dane, mogę uruchomić je przez ten węzeł sprawdzania kondycji danych, i sprawdza, czy istnieją niezmienności, rzadkość i wartości odstające, i wszystkie te rzeczy, uzupełnia brakujące wartości i robi dużo matematyki Nie rozumiem, więc mogę zaakceptować wartości domyślne lub, jeśli jestem trochę bardziej sprytny, mogę je zmienić. Chodzi o to, że chcemy zautomatyzować ten proces. To robi około 15 różnych kontroli i wyników na oczyszczonym zbiorze danych. To, co robimy, ułatwia ludziom tworzenie takich przepływów pracy.

To tutaj mówimy o współpracy między naukowcami danych i naukowcami danych obywatelskich. Jeśli spojrzymy na te obrazy po prawej stronie, zobaczymy ten proces przygotowania danych. I może to jest bardzo wyrafinowane, może to tajny sos twojej firmy, nie wiem, ale wiemy, że ktoś w twojej organizacji może uzyskać dostęp do jednego lub więcej z tych silosów danych, które mamy. Potrzebujemy sposobu, aby po pierwsze, złapać je i połączyć je, a po drugie, być może chcemy specjalnego przetwarzania, które wykracza poza naszą kontrolę danych, i to jest tajny sos Twojej firmy. Mogę utworzyć ten obieg pracy w naszej organizacji, który zwalnia się jako węzeł. Widzisz strzałkę skierowaną w dół, to tylko węzeł, a my możemy mieć sto takich rzeczy w organizacji. Chodzi o to, że mamy ludzi, którzy wiedzą coś o określonej przestrzeni, mogą stworzyć przepływ pracy, a ktoś inny może tego ponownie użyć. Staramy się zminimalizować nowe koło.

I możemy zrobić to samo z przepływami pracy modelowania analitycznego. W tym przypadku po prawej ten przepływ pracy może być 15 różnych algorytmów i chcę wybrać najlepszy dla tego zadania. I nie muszę rozumieć jako naukowiec danych obywatelskich, co się tam dzieje w tym bałaganie pająka, ale po prostu zapada się w węzeł, a może ten węzeł po prostu mówi: „oblicz wynik ryzyka kredytowego”. „Oblicz szansę infekcji miejsca operowanego ”, co masz. „Oblicz prawdopodobieństwo, że coś jest nieuczciwą transakcją”. Jako badacz danych obywatelskich mogę korzystać z tej bardzo wyrafinowanej matematyki, którą stworzył ktoś inny, być może jeden z tych naukowców zajmujących się danymi w mojej organizacji.

Z punktu widzenia nauki o danych, wiesz, rozmawiałem z naukowcami danych, którzy uwielbiają pisać kod, i rozmawiałem z naukowcami danych, którzy nie lubią pisać kodu. I to dobrze, więc mamy bardzo wizualny, graficzny interfejs użytkownika. Możemy pobrać nasze dane, przeprowadzić automatyczną kontrolę stanu danych i być może chcę napisać kod. Lubię Pythona, lubię R, ale pomysł jest taki, że tych naukowców danych brakuje, i podoba im się kod w określonym języku. Nie szczególnie preferujemy język, w którym chcesz pisać, więc jeśli chcesz zrobić R, zrób R; jeśli chcesz zrobić Python, zrób Python. To wspaniale. Jeśli chcesz rozdzielić dane analityczne na platformę Azure, rozbij dane analityczne do chmury. A zatem celem tutaj jest naprawdę zaoferowanie elastyczności i opcji, dzięki którym twoi naukowcy danych będą tak produktywni, jak to tylko możliwe.

Teraz naukowcy danych to dość mądrzy ludzie, ale może nie są specjalistami od wszystkiego, a może są pewne luki w tym, co mogą zrobić. A jeśli spojrzysz na przemysł, istnieje wiele różnych rynków analitycznych, które istnieją. To jest przykład, może potrzebuję rozpoznać obraz i nie mam tej umiejętności, może pójdę do Algorytmii i uzyskam algorytm rozpoznawania obrazu. Może pójdę do Apervita i otrzymam specjalny algorytm opieki zdrowotnej. Może chcę użyć czegoś w bibliotece uczenia maszynowego platformy Azure. Może chcę użyć czegoś w natywnej platformie Statistica.

Ponownie chodzi o to, że chcemy wykorzystać globalną społeczność analityczną. Ponieważ nie będziesz mieć wszystkich umiejętności w swoich czterech ścianach, więc jak możemy stworzyć oprogramowanie - i właśnie to robimy - które pozwala twoim naukowcom danych korzystać z algorytmów z różnych rynków. Robimy to z R i Pythonem od dłuższego czasu, ale rozszerza to na te rynki aplikacji, które istnieją. I tak samo, jak tutaj na górze, używamy H2O w Spark, więc jest tam wiele algorytmów analitycznych. Nie musisz skupiać się na tworzeniu ich od zera, wykorzystajmy te, które żyją w społeczności open source, a my chcemy, aby ci ludzie byli jak najbardziej produktywni.

Kolejnym krokiem po tym, jak mamy naszych naukowców zajmujących się danymi i obywatelami, jest to, w jaki sposób promujesz i rozpowszechniasz te najlepsze praktyki? W naszym oprogramowaniu znajduje się technologia, która pozwala dystrybuować dane analityczne w dowolnym miejscu. Jest to bardziej widok zarządzania modelami, ale nie jestem już związany czterema ścianami ani konkretną instalacją w Tulsa, Tajwanie lub Kalifornii ani czymkolwiek innym. Jest to platforma globalna i mamy wielu klientów, których używa w wielu witrynach.

I tak naprawdę kluczowe rzeczy są takie: jeśli robisz coś na Tajwanie i chcesz to powtórzyć w Brazylii, to świetnie. Wejdź tam, chwyć szablony wielokrotnego użytku, chwyć wymagane przepływy pracy. To jest próba stworzenia tych standardów i wspólnego sposobu robienia rzeczy, więc nie robimy rzeczy zupełnie inaczej. Innym kluczowym elementem tego jest to, że naprawdę chcemy wziąć matematykę do miejsca, w którym żyją dane. Nie trzeba tasować danych między, wiesz, Kalifornią a Tulsą a Tajwanem i Brazylią. Mamy technologię, która pozwala nam wziąć matematykę do danych, i będziemy mieć kolejną emisję internetową Hot Technology na ten temat.

Ale my nazywamy tę architekturę, a tutaj jest wgląd, Native Distributed Analytics Architecture. Kluczową ideą tego jest to, że mamy platformę, Statistica, i mogę wyeksportować analityczny przepływ pracy jako atom. I mógłbym zrobić model lub cały przepływ pracy, więc to nie ma znaczenia. Ale mogę to stworzyć i wyeksportować w języku odpowiednim dla platformy docelowej. Po lewej stronie robi to wiele osób, ale oceniają w systemie źródłowym. W porządku, możemy punktować i budować modele w bazie danych, więc to interesujące.

A potem po prawej stronie mamy Boomi. To technologia towarzysząca, pracujemy z nimi wszystkimi. Ale możemy również wziąć te przepływy pracy i zasadniczo przenieść je w dowolne miejsce na świecie. Wszystko, co ma adres IP. I nie muszę mieć Statistica zainstalowanego w chmurze publicznej lub prywatnej. Wszystko, co może obsługiwać JVM, możemy uruchamiać te analityczne przepływy pracy, przepływy pracy przygotowania danych lub po prostu modele na dowolnej z tych platform docelowych. Niezależnie od tego, czy znajduje się w mojej publicznej, czy prywatnej chmurze, czy to w moim ciągniku, samochodzie, moim domu, mojej żarówce, moim Internecie rzeczy, mamy technologię, która pozwala Ci przetransportować te przepływy pracy w dowolne miejsce na świecie.

Przejrzyjmy. Wiesz, że mamy użytkowników biznesowych, więc ci ludzie, mamy technologię, która pozwala im zużywać dane wyjściowe w formacie, który im odpowiada. Mamy naukowców zajmujących się danymi obywatelskimi, a my staramy się usprawnić współpracę, włączyć ich do zespołu, prawda? Dlatego chcemy, aby ludzie przestali wymyślać koło ponownie. I mamy tych naukowców zajmujących się danymi, może istnieć luka w umiejętnościach, ale mogą pisać w języku, który chcą, mogą iść na rynek analityczny i używać tam algorytmów. A zatem, dlaczego nie pomyślałeś, że wszystko jest w tym niesamowite? To jest idealne, właśnie to robimy. Budujemy przepływy pracy wielokrotnego użytku, udzielamy ludziom instrukcji, dajemy im klocki Lego, aby mogli budować te potężne zamki i cokolwiek chcą robić. Podsumowując, mamy platformę, która wzmacnia pozycję użytkowników biznesowych, naukowców zajmujących się danymi obywatelskimi, naukowców zajmujących się programowaniem, mamy - możemy zająć się każdym rodzajem zastosowania analizy brzegowej IoT i umożliwiamy to pojęcie kolektywnej inteligencji. Po tym, myślę, że prawdopodobnie otworzymy to na pytania.

Robin Bloor: Cóż, w porządku. Myślę, że pierwszy - szczerze mówiąc, mam na myśli, że zostałem wcześniej poinformowany przez Dell Statistica, i szczerze mówiąc, jestem naprawdę zaskoczony rzeczami, o których nie wiedziałem, że wspomniałeś w prezentacji . I muszę powiedzieć, że jedno: to było dla mnie problemem w przyjmowaniu analiz, czy wiesz, że zdobywanie narzędzi nie jest, prawda? Jest tam strasznie dużo narzędzi, są narzędzia open source i tak dalej, i tak dalej, i są różne, jak to nazwałbym, pół-platformy. Ale myślę, że różnicę, którą masz, byłem pod szczególnym wrażeniem części przepływu pracy.

Ale różnica polega na tym, że wydajesz się zapewniać od końca do końca. To tak, jakby analiza była złożonym procesem biznesowym, który zaczyna się od akwizycji danych, a następnie przechodzi przez cały szereg kroków, w zależności od stopnia kruchości danych, a następnie może rozgrywać się w szeregu różnych matematycznych ataków na dane. A potem wyniki pojawiają się w taki czy inny sposób i muszą to być działania. Istnieje ogromna ilość analiz, z którymi się spotkałem, gdzie wykonano wiele świetnej pracy, ale nie można jej wcielić w życie. I wydaje się, że masz okropnie dużo tego, co jest wymagane. Nie wiem, jak wszechstronny jest, ale o wiele bardziej niż się spodziewałem. Jestem pod tym niesamowicie pod wrażeniem.

Chciałbym, abyś skomentował arkusze kalkulacyjne. Już coś powiedziałeś, ale jedną z rzeczy, które zauważyłem, i które zauważyłem przez lata, ale staje się coraz bardziej widoczne, że istnieje bardzo dużo arkuszy kalkulacyjnych, które są systemami cieni i naprawdę myślę, że Arkusz kalkulacyjny, to znaczy, było cudownym narzędziem, kiedy zostało wprowadzone i było wspaniałe, ponieważ na wiele różnych sposobów, ale jest to ogólne narzędzie, ale tak naprawdę nie nadaje się do celu. Z pewnością nie jest zbyt dobry w kontekście BI i myślę, że jest okropny w kontekście analitycznym. Zastanawiałem się, czy masz jakiś komentarz do powiedzenia, powiedzmy, przykłady, w których Statistica się wypłukała, nadmierne użycie arkusza kalkulacyjnego lub jakikolwiek komentarz na ten temat?

David Sweenor: Tak, myślę, że możesz poszukać słynnych błędów w arkuszach kalkulacyjnych. Google lub jakakolwiek wyszukiwarka, której używasz, wróci z dużą ilością wyników. Nie sądzę, wiesz, że kiedykolwiek zastąpimy arkusze kalkulacyjne. To nie jest nasza intencja, ale w wielu organizacjach, do których chodzę, jest kilku takich czarodziejów arkuszy kalkulacyjnych lub ninja, czy jakkolwiek chcesz je nazwać, ale oni mają te bardzo wyrafinowane arkusze kalkulacyjne i musisz pomyśleć, co się stanie, gdy te ludzie wygrywają w lotto i nie wracają? I dlatego staramy się wiedzieć, że arkusze kalkulacyjne będą istnieć, abyśmy mogli je spożywać, ale myślę, że staramy się stworzyć wizualną reprezentację Twojego przepływu pracy, aby można go było zrozumieć i udostępnić innym osobom . Arkusze kalkulacyjne są dość trudne, bardzo trudne do udostępnienia. Gdy tylko prześlesz mi mój arkusz kalkulacyjny, zmieniłem go, a teraz nie jesteśmy zsynchronizowani i otrzymujemy różne odpowiedzi. To, co próbujemy zrobić, to umieścić wokół tego barierki i sprawić, by sprawy były nieco bardziej wydajne. Arkusze kalkulacyjne są naprawdę okropne w łączeniu wielu zestawów danych razem, wiesz? Upadają tam. Ale nie zamierzamy ich zastępować, połykamy ich i mamy ludzi, którzy zaczynają się zmieniać, ponieważ jeśli mamy węzeł, który mówi „oblicz ryzyko”, to właśnie stara się osoba korzystająca z arkusza kalkulacyjnego. Więc ich nie ma.

Robin Bloor: Tak, to znaczy, powiedziałbym, że z jednej perspektywy, na którą patrzę, powiedziałbym, że arkusze kalkulacyjne są świetne do tworzenia informacji. Są nawet świetne do tworzenia wysp wiedzy, ale są naprawdę złe do dzielenia się wiedzą. Nie mają żadnego mechanizmu, aby to zrobić, a jeśli przekażesz komuś arkusz kalkulacyjny, to nie tak, że możesz go przeczytać, jakby to był artykuł dokładnie wyjaśniający, co robią. Po prostu go nie ma. Myślę, że to, co zrobiło na mnie największe wrażenie w prezentacji i możliwościach Statistiki, wydaje się niesamowicie agnostyczne. Ale ma ten wątek przepływający przez przepływ pracy. Czy mam rację, zakładając, że możesz przyjrzeć się kompleksowemu przepływowi pracy od wieszania, od gromadzenia danych aż po osadzanie wyników w konkretnych aplikacjach BI, a nawet uruchamianie aplikacji?

David Sweenor: Tak, absolutnie. I ma to kompleksowe możliwości, a niektóre organizacje wykorzystują to całkowicie, i nie mam złudzeń, że żadna firma obecnie kupuje wszystko od jednego dostawcy. Mamy miks. Niektórzy używają Statistica do wszystkiego, a niektórzy używają jej do przepływów pracy modelowania, niektórzy używają jej do przepływów pracy przygotowania danych. Niektóre osoby używają go do rozpowszechniania setek raportów inżynieryjnych wśród inżynierów. A więc mamy wszystko pomiędzy. I to jest naprawdę kompleksowe i jest to, wiesz, platforma agnostyczna, w tym sensie, jeśli istnieją algorytmy, których chcesz użyć w języku R lub Python, Azure, Apervita, cokolwiek, wiesz, użyj ich. To wspaniale, bądź produktywny, używaj tego, co wiesz, używaj tego, z czym czujesz się komfortowo, a my mamy mechanizmy, które zapewniają, że są one kontrolowane i kontrolowane, i tak dalej.

Robin Bloor: Szczególnie podoba mi się ten aspekt. To znaczy, nie wiem, czy możesz mówić ponad to, co powiedziałeś, o bogactwie tego, co tam jest. To znaczy, obejrzałem to, ale nie spojrzałem na to w sposób kompleksowy i na pewno w naszych bibliotekach jest ogromna liczba bibliotek Python, ale czy jest coś, co możesz dodać do tego obrazu? Ponieważ myślę, że to bardzo interesująca rzecz, wiesz, pomysł, aby mieć komponenty, które były godne zaufania, ponieważ znałeś różnych ludzi, którzy je stworzyli, i różnych ludzi, którzy ich używali, i które można pobrać. Wiesz, czy możesz wzbogacić to, co już o tym powiedziałeś?

David Sweenor: Tak, myślę, że niektóre rynki aplikacji, wiesz, rynki algorytmów, które są tam. Na przykład, wiesz, dr John Cromwell z University of Iowa, opracował model, który będzie przewidywał, że używany w czasie rzeczywistym, podczas gdy jesteśmy operowani, da ci ocenę, jeśli chcesz uzyskać infekcja miejsca chirurgicznego. A jeśli ten wynik jest wystarczająco wysoki, podejmą interwencję bezpośrednio na sali operacyjnej. To bardzo interesujące. Więc może jest inny szpital, który nie jest tak duży. Cóż, Apervita to rynek aplikacji służących do analizy zdrowia. Możesz albo znaleźć jeden na wielu tych portalach z aplikacjami, możesz znaleźć jeden i użyć ich ponownie, a transakcja jest między tobą a kimkolwiek, ale możesz albo znaleźć jeden, albo powiedzieć: „Oto czego potrzebuję. ”Myślę, że wykorzystuje tę globalną społeczność, ponieważ wszyscy są obecnie specjalistami i nie możesz wiedzieć wszystkiego. Myślę, że R i Python to jedno, ale idea: „Chcę wykonać tę funkcję, umieścić specyfikację na jednym z tych rynków z aplikacjami i pozwolić, aby ktoś ją opracował”. Myślę, że mogą to zarabiać, myślę to bardzo interesujące i bardzo różni się od czysto otwartego modelu.

Robin Bloor: W porządku. W każdym razie przekażę piłkę Dezowi. Chcesz się zanurzyć, Dez?

Dez Blanchfield: Absolutnie i chciałbym przez chwilę pozostać przy arkuszu kalkulacyjnym, ponieważ myślę, że uchwycił właściwy sens wielu rzeczy, o których tutaj mówimy. I skomentowałeś, Robin, w odniesieniu do przejścia od pewnego rodzaju starych arkuszy kalkulacyjnych w formie fizycznej do formy elektronicznej. Mieliśmy interesującą rzecz, w której, jak wiesz, kiedy arkusze kalkulacyjne były pierwotnie rzeczą, były to po prostu kartki papieru z rzędami i kolumnami, a ty ręcznie zapisywałeś rzeczy, a następnie sprawdzałeś je i obliczałeś, robiąc to z czubka głowy lub za pomocą innego urządzenia. Nadal jednak mamy okazję, aby błędy wymknęły się z błędami pisma ręcznego lub dysleksją, a teraz zastąpiliśmy je literówkami. Ryzyko polega na tym, że w przypadku arkuszy kalkulacyjnych profil ryzyka jest szybszy i większy, ale myślę, że narzędzia takie jak Statistica odwracają piramidę ryzyka.

Często rysuję to zdjęcie na białej tablicy postaci człowieka na górze, jako jedna osoba, a następnie ich kolekcję na dole, powiedzmy, wyobraź sobie dziesięć z nich na dole tej tablicy i rysuję piramida, w której punkt piramidy znajduje się u jednej osoby, a stopa piramidy jest zbiorem ludzi. I używam tego do wizualizacji pomysłu, że jeśli jedna osoba na górze zrobi arkusz kalkulacyjny, popełni błąd i udostępni go dziesięciu osobom, a teraz mamy dziesięć kopii błędu. Bądź bardzo ostrożny z makrami i bądź bardzo ostrożny z Visual Basic, jeśli zamierzasz do tego przejść. Ponieważ kiedy budujemy narzędzia elektroniczne, takie jak arkusze kalkulacyjne, jest to bardzo potężne, ale jest również wydajne w dobry i zły sposób.

Myślę, że narzędzia takie jak Statistica umożliwiają odwrócenie tego profilu ryzyka, dzięki czemu możesz teraz przejść do punktu, w którym masz wiele narzędzi, które są dostępne dla konkretnej osoby, a także z wielu narzędzi u góry piramida, a następnie do samego dna, w którym odwrócony punkt piramidy jest właściwym narzędziem, jeśli mamy zespół ludzi, którzy budują te narzędzia i algorytmy. A naukowiec danych nie musi być specjalistą w dziedzinie regresyjnej analizy swoich danych. Mogą być w stanie korzystać z tego narzędzia, ale możesz mieć pięciu lub sześciu statystyk, aktuariusza i naukowca danych oraz niektórych matematyków pracujących nad tym narzędziem, modułem, algorytmem, wtyczką itp. W języku arkusza kalkulacyjnego, więc wyobraź sobie, że każdy opublikowany arkusz kalkulacyjny został napisany przez specjalistów, którzy przetestowali makra, przetestowali Visual Basic, upewnili się, że algorytmy działają, więc kiedy go dostaniesz, możesz po prostu wstawić do niego dane, ale tak naprawdę nie możesz go złamać i dlatego lepiej było kontrolować.

Myślę, że robi to wiele narzędzi analitycznych. Chyba dochodzę do tego, że teraz widzisz to w terenie, czy widzisz przejście od arkuszy kalkulacyjnych, które potencjalnie mogą popchnąć błędy, pomyłki i ryzyko, do momentu, w którym narzędzia, które budujesz za pomocą platformy teraz, odkrycie danych jest dokładne w czasie rzeczywistym, a ludzie, którzy budują moduły i algorytmy usuwają lub zmniejszają ten profil ryzyka? Czy obsługa klienta widzi to w prawdziwym sensie, czy uważasz, że tak się dzieje i nie zdają sobie z tego sprawy?

David Sweenor: Wiesz, myślę, że jest kilka sposobów, aby na to odpowiedzieć. Ale widzimy, jak wiecie, w każdej organizacji i wspomniałem, że analityka, jak sądzę, może pozostawać w tyle z perspektywy inwestycji korporacyjnych, coś w rodzaju tego, co zrobiliśmy z magazynowaniem danych i CRM. Ale to, co widzimy, wymaga więc zmiany organizacji i pokonania tej bezwładności organizacyjnej. Ale widzimy ludzi, którzy biorą arkusze kalkulacyjne, biorą przepływ pracy, a ja wspomniałem o bezpieczeństwie i zarządzaniu: „Cóż, może mam arkusz kalkulacyjny”, „Cóż, mogę to zablokować i mogę kontrolować wersję”. I widzimy wiele organizacji, być może zaczynają właśnie tam. A jeśli to się zmieni, to jest przepływ pracy, a ja kończę, jednak numer jeden, kto to zmienił? Dlaczego to zmienili? Kiedy to zmienili. Mogę również skonfigurować przepływ pracy, aby nie wprowadzać tego nowego arkusza kalkulacyjnego do produkcji, chyba że zostanie zweryfikowany i zweryfikowany przez jeden, dwa, trzy, niezależnie od tego, ile stron chcesz zdefiniować w swoim przepływie pracy. Myślę, że ludzie zaczynają podejmować działania, a organizacje zaczynają robić tam małe kroki, ale prawdopodobnie sugerowałbym, że przed nami długa droga.

Dez Blanchfield: Rzeczywiście i myślę, że biorąc pod uwagę, że budujesz zarówno kontrolę bezpieczeństwa, jak i zarządzanie tam, obciążenie pracą może automatycznie odwzorować to i wszystko aż do głównego oficera ryzyka, co jest teraz rzeczą. Możesz zacząć kontrolować, w jaki sposób te narzędzia i systemy są dostępne i kto z nimi robi, więc jest to bardzo potężne. Myślę, że inne rzeczy, które do tego dochodzą, polegają na tym, że rodzaje narzędzi, które udostępniasz, bardziej odpowiadają na ludzkie zachowanie niż na tradycyjne arkusze kalkulacyjne, o których mówimy, jeśli mam pokój pełen ludzi z tym samym pulpitem nawigacyjnym i dostępem do tych samych danych, które mogą uzyskać inny widok, w wyniku czego uzyskują nieco inne spostrzeżenia z tych samych informacji, które odpowiadają ich potrzebom, aby mogli współpracować. Mamy wtedy bardziej ludzki pogląd i interakcję z biznesem i procesem decyzyjnym, w przeciwieństwie do tego, że wszyscy chodzą na to samo spotkanie z tym samym programem PowerPoint i drukują te same arkusze kalkulacyjne, wszystkie te same stałe dane.

Czy widzisz zmianę w zachowaniu i kulturze w organizacjach, które w pewnym sensie przejmują twoje narzędzia tam, gdzie widzą, że ma to miejsce, gdzie to nie jest tak, że pięć osób w pokoju patrzy na ten sam arkusz kalkulacyjny, próbując go po prostu werbalizować i robić notatki na jego temat, ale teraz faktycznie komunikują się z pulpitami nawigacyjnymi i narzędziami w czasie rzeczywistym, z wizualizacją i analizami na wyciągnięcie ręki i uzyskują zupełnie inny przebieg rozmowy i interakcji, nie tylko podczas spotkań, ale po prostu ogólna współpraca wokół organizacji? Ponieważ mogą to robić w czasie rzeczywistym, ponieważ mogą zadawać pytania i uzyskać prawdziwą odpowiedź. Czy to trend, który widzisz w tej chwili, czy może jeszcze się to nie wydarzyło?

David Sweenor: Nie, myślę, że zdecydowanie zaczęło się na tej ścieżce i myślę, że bardzo interesującą rzeczą jest, wiesz, jeśli weźmiemy na przykład przykład fabryki. Być może ktoś, kto jest właścicielem określonego sektora procesu w tej fabryce, chce w określony sposób wyglądać i wchodzić w interakcję z tymi danymi. A może ja, pomijając wszystkie procesy, może ten na dole, może chcę to wszystko przejrzeć. Myślę, że widzimy, po pierwsze, ludzie zaczynają używać wspólnego zestawu wizualizacji lub standardowych wizualizacji w swoich organizacjach, ale są one również dostosowane do roli, w której pełnią. Jeśli jestem inżynierem procesu, być może to jest zupełnie inny punkt widzenia niż ktoś, kto patrzy na to z perspektywy łańcucha dostaw, i myślę, że to świetnie, ponieważ trzeba go dostosować i spojrzeć przez obiektyw, który jest potrzebny do wykonania pracy.

Dez Blanchfield: Wydaje mi się, że proces decyzyjny spowalnia czas i szybkość, aby podejmowanie mądrych i trafnych decyzji również gwałtownie wzrosło, prawda? Ponieważ jeśli masz analitykę w czasie rzeczywistym, pulpity nawigacyjne w czasie rzeczywistym, jeśli masz narzędzia Statistica na wyciągnięcie ręki, nie musisz biegać po podłodze, aby zapytać kogoś o coś, masz to w wersji papierowej. Możesz w pewien sposób współpracować, wchodzić w interakcje i podejmować decyzje w locie, aby natychmiast uzyskać ten wynik. Wydaje mi się, że niektóre firmy jeszcze tego nie zrozumiały, ale kiedy to zrobią, będzie to ta eureka chwila, w której tak, nadal możemy pozostać w naszych kabinach i pracować w domu, ale możemy współdziałać i współpracować oraz podejmować te decyzje dzięki współpracy natychmiast zmieniamy się w wyniki. Słuchaj, myślę, że to było fantastyczne usłyszeć, co do tej pory musiałaś powiedzieć, i naprawdę nie mogę się doczekać, aby zobaczyć, co się stanie. I wiem, że mamy wiele pytań w pytaniach i odpowiedziach, więc zamierzam pobiec z powrotem do Rebecca, aby przejrzeć niektóre z nich, abyśmy mogli dotrzeć do nich tak szybko, jak to możliwe. Dziękuję Ci bardzo.

Rebecca Józwiak: Dzięki Dez i tak Dave, mamy sporo pytań od publiczności. I dzięki Dez i Robin za twoje spostrzeżenia. Wiem, że ta konkretna uczestniczka musiała wysiąść w samą porę, ale ona pyta, czy widzisz, że działy systemów informatycznych kładą większy nacisk na wyrafinowane kontrole danych niż wygodę w dostarczaniu narzędzi do pracownicy wiedzy? Mam na myśli, czy to jest - śmiało.

David Sweenor: Tak, myślę, że to zależy od organizacji. Myślę, że bank, firma ubezpieczeniowa, może mają różne priorytety i sposoby działania, w porównaniu do organizacji marketingowej. Chyba muszę powiedzieć, że zależy to tylko od branży i funkcji, na którą patrzysz. Różne branże mają różne cele i akcenty.

Rebecca Jóźwiak: Dobra, to ma sens. A potem inny uczestnik chciał wiedzieć, jaki jest silnik Statistica? Czy to C ++ czy twoje własne rzeczy?

David Sweenor: Cóż, nie wiem, czy mogę to z tym zrobić, ponieważ było to od 30 lat i zostało opracowane przed moim czasem, ale istnieje podstawowa biblioteka algorytmów analitycznych, które są uruchomionymi algorytmami Statistica. Widziałeś tutaj, że możemy również uruchomić R, możemy uruchomić Python, możemy przełączyć się na platformę Azure, możemy uruchomić Spark na H2O, więc myślę, że musiałbym odpowiedzieć na to pytanie, jeśli chodzi o różne silniki. I w zależności od wybranego algorytmu, jeśli jest to Statistica, działa w ten sposób, jeśli wybierzesz jeden na H2O i Spark, używa tego, a więc jest ich wiele.

Rebecca Jóźwiak: Dobra. Inny uczestnik zapytał konkretnie o ten slajd, chcąc dowiedzieć się, w jaki sposób, w jaki sposób badacz danych obywatelskich wie, jakich szablonów wielokrotnego użytku użyć? I wydaje mi się, że z tego zrobię trochę szersze pytanie. To, co widzisz, gdy przychodzą użytkownicy z linii biznesowej lub analitycy biznesowi i chcą korzystać z tych narzędzi, jak łatwo jest im odebrać i uruchomić?

David Sweenor: Wydaje mi się, że odpowiedziałbym na to pytanie, a jeśli możesz użyć, jeśli znasz system Windows, jest to platforma oparta na systemie Windows, więc odciąłem górną część tych zrzutów ekranu, ale ma wstążkę Windows. Ale skąd wiedzą, jakiego przepływu pracy użyć? Wygląda jak Eksplorator Windows, więc istnieje struktura drzewa, którą można skonfigurować i skonfigurować w sposób, w jaki chce tego Twoja organizacja. Ale może się zdarzyć, że będziesz mieć te foldery i umieścisz szablony wielokrotnego użytku w tych folderach. I myślę, że prawdopodobnie istnieje nomenklatura, którą Twoja firma mogłaby zastosować, powiedzmy, że „oblicz profil ryzyka”, oto „pobierz dane z tych źródeł” i nazwij je, jak chcesz. To tylko darmowy folder, po prostu przeciągasz notatki prosto na płótno. To całkiem proste.

Rebecca Jóźwiak: Dobra. Może następnym razem demo. Potem pojawia się inny rodzaj uczestnika, o czym rozmawialiście ty, Robin i Dez aż do nieścisłości, zwłaszcza w arkuszu kalkulacyjnym, ale śmieci w / w śmieci, a on uważa to za jeszcze bardziej krytyczne, gdy przychodzi do analizy. Wspomnieć, że niewłaściwe wykorzystanie danych może naprawdę prowadzić do niefortunnych decyzji. I zastanawia się, jakie są twoje poglądy na temat opracowywania bardziej bezpiecznych algorytmów, jak sądzę, używa słowa „nadgorliwe” wykorzystanie analityki. Wiesz, ktoś wchodzi, jest naprawdę podekscytowany, chce przeprowadzić te zaawansowane analizy, chce uruchomić te zaawansowane algorytmy, ale może nie jest do końca pewien. Co więc robisz, aby się przed tym zabezpieczyć?

David Sweenor: Tak, więc chyba odpowiem na to najlepiej jak potrafię, ale myślę, że wszystko sprowadza się do ludzi, procesu i technologii. Mamy technologię, która pomaga ludziom i umożliwiać dowolny proces, który chcesz wprowadzić w swojej organizacji. W przykładzie wysyłania komuś kuponu, może to nie jest tak ważne, a jeśli jest cyfrowe, to naprawdę nie kosztuje, może jest jeden poziom kontroli bezpieczeństwa i może nas to nie obchodzi. Jeśli przewiduję infekcje miejsca chirurgicznego, być może chcę być bardziej ostrożny. A jeśli przewiduję jakość i bezpieczeństwo narkotyków i tym podobne rzeczy, być może chcę być bardziej ostrożny. Masz rację, wyrzucanie śmieci / wyrzucanie śmieci, więc staramy się zapewnić platformę, która pozwala ci dostosować je do dowolnego procesu, który twoja organizacja chce zastosować.

Rebecca Jóźwiak: Dobra. Mam jeszcze kilka pytań, ale wiem, że minęło już nieco ponad godzinę i chcę tylko powiedzieć naszym prezenterom, że to było niesamowite. Chcemy bardzo podziękować Dave'owi Sweenorowi z Dell Statistica. Oczywiście, dr Robin Bloor i Dez Blanchfield, dziękuję za bycie dziś analitykami. W przyszłym miesiącu planujemy kolejną transmisję internetową z Dell Statistica. Wiem, że Dave podpowiedział coś na ten temat. Chodzi o analitykę na krawędzi, kolejny fascynujący temat, i wiem, że niektóre bardzo ważne przypadki użycia zostaną omówione w tej transmisji internetowej. Jeśli podobało Ci się to, co widziałeś dzisiaj, wróć po więcej w przyszłym miesiącu. I z tym wszystkim, żegnam was. Dzięki wielkie. PA pa.

Wszędzie osadzaj analitykę: umożliwiając naukowcowi danych obywatelskich