Przez Techopedia Staff, 29 marca 2017 r
Na wynos: gospodarz Eric Kavanagh omawia wywiad gospodarczy z dr Robin Bloor i Stanem Geigerem z IDERA.
Obecnie nie jesteś zalogowany. Zaloguj się lub zarejestruj, aby zobaczyć wideo.
Eric Kavanagh: Panie i panowie, witamy ponownie, jest środa o 4:00 czasu wschodniego i przez ostatnie kilka lat oznaczało to, że nadszedł czas na Hot Technologies, tak, rzeczywiście. Nazywam się Eric Kavanagh, będę gospodarzem dzisiejszego programu. Uwielbiam ten temat: „Kontrola zdrowia: Utrzymanie zdrowego BI dla przedsiębiorstw”, o tym właśnie dzisiaj porozmawiamy. Naprawdę jest w tobie miejsce.
Tak więc w tym roku jest gorąco - Hot Technologies naprawdę zaprojektowano, aby zdefiniować poszczególne rodzaje technologii i można sobie wyobrazić, że w świecie oprogramowania dla przedsiębiorstw jest wielu dostawców, którzy sprzedają różnego rodzaju produkty i co tam się dzieje to te modne słowa, które kończą się przyzwyczajaniem i przechwytywaniem przez różnych dostawców dla bardzo różnych rzeczy. I tak, celem tego serialu jest naprawdę pomóc naszym przyjaciołom-sprzedawcom i pomóc naszym odbiorcom zarówno zidentyfikować, jak i otoczyć nasze głowy tym, czym naprawdę są konkretne technologie i co oznaczają te słowa, gdy przejdziesz do mosiężnych haczyków.
Będę dziś jednym z analityków, mamy również Roberta Bloora na linii i Stana Geigera z IDERA. Porozmawiajmy szybko o znaczeniu inteligencji biznesowej i analityki w ogóle. Jest to podstawowe drzewo decyzyjne, jeśli chcesz, lub schemat blokowy, który mówi o tym, jak pracujesz nad problemami w Twojej firmie, rozmawiasz na różne tematy, tworzysz propozycje, a potem dowiadujesz się, co ludzie myślą. Czy oni się zgadzają? Czy się nie zgadzają? Jaki jest konsensus, jeśli go masz, i jak pracujesz przez ten proces?
Cóż, to wszystko jest oczywiście bardzo ogólne, ale jest to dobre przypomnienie procesu, w którym proponujemy pomysły w firmach, podejmujemy decyzje, a następnie idziemy do przodu. Najważniejsze jest to, że dane są wymagane dla każdego z tych składników. Jest to tym bardziej prawdziwe w dzisiejszych czasach w świecie dużych zbiorów danych, ponieważ oczywiście duże zbiory danych są jak ten gigantyczny silnik prawdy. Duże zbiory danych są naprawdę tym, co się dzieje; reprezentuje to, gdzie jest, co robi, co kupuje, co obsługuje ich serwis społecznościowy, na przykład tweetowanie. Oczywiście, wszystkie te rzeczy mogą zostać zhakowane - musisz na to uważać - ale chodzi o to, że dane są, jeśli chcesz, architekturą odniesienia dla rzeczywistości.
Potrzebujesz danych na każdym etapie procesu decyzyjnego. Teraz konsensus jest ważny. Jeśli chcesz zadowolonych użytkowników, czasami szef musi być w sprzeczności z tym, czego wszyscy chcą. Właśnie rozmawialiśmy o Steve'ie Jobsie tuż przed rozpoczęciem tego webcastu, a on był znany z tego rodzaju rzeczy. Ma słynny cytat, w którym zaleca, aby ludzie zagłuszyli hałas, który słyszą wokół, a następnie trzymali się swojej wizji, jeśli wiedzą, że to, co robią, jest właściwe. Nie zawsze potrzebujesz konsensusu, ale zazwyczaj jest to całkiem dobry pomysł. Ale ogólnym celem tego slajdu i tego komentarza jest uświadomienie sobie, jak ważne jest, abyśmy podejmowali decyzje w oparciu o dane, a nie tylko instynkt, chociaż odwaga zazwyczaj pomaga naprawdę wiedzieć, dokąd chcesz się udać, a następnie naprawdę chcesz to zweryfikować lub unieważnić za pomocą swoich danych. I powiedziałbym, że nie bójcie się spojrzeć w przeszłość, tak jak miły, mały marker, lub przypomnieć, że kiedy spojrzysz za siebie czasami, możesz przynajmniej uzyskać punkt odniesienia i zrozumieć, gdzie byłeś pochodzić od i być szczerym na temat popełnionych błędów. Wszyscy popełniamy błędy, to się zdarza.
Tak więc, jeśli masz problemy z wydajnością w swoich systemach Business Intelligence, cóż, istnieje stare wyrażenie „cierpliwość jest cnotą”, nie w świecie IT, mogę ci teraz powiedzieć. Jeśli użytkownicy długo czekają na powrót zapytań lub nie otrzymują raportów, powoduje to osłabienie zaufania, a gdy zaufanie nie ma, bardzo trudno je odzyskać. Dlatego umieściłem tutaj linię - około 40 sekund w dzisiejszych czasach to około 40 minut - jeśli zapytanie zajmie 40 sekund, ludzie zapominają o czym w ogóle mówią, o co pytają danych. Wyobraź sobie, że w rozmowie zapytasz kogoś, powiedzmy swojemu szefowi: „Hej, chciałbym wiedzieć, dlaczego idziemy tą drogą”. I musiałeś poczekać 40 sekund w rozmowie uzyskać odpowiedź? Wyszedłbyś z pokoju! Można by pomyśleć, że twój szef oszalał. Tak więc opóźnienie, które mamy w niektórych systemach informatycznych, gdy występują problemy z wydajnością, które skróci proces analityczny, przepływ analityczny lub, jak niektórzy to nazywają, rozmowę prowadzoną z Twoimi danymi. Musisz przyspieszyć w tych systemach, cokolwiek musisz zrobić, aby to zrobić, a my porozmawiamy o tym dzisiaj, właśnie to musisz zrobić, ponieważ bez tego płynnego przepływu pomysłów tam iz powrotem, jesteś naprawdę uszkadza cały proces analizy. I ponownie wyrzucam ten komentarz: brak zaufania jest cichym zabójcą. Ludzie tak naprawdę nie podniosą zbytnio rąk, jeśli ci nie ufają, ale po prostu spojrzą na ciebie z boku i zastanawiają się, co się dzieje. A kiedy zaufanie zniknie, będziesz miał bardzo, bardzo trudny czas na odzyskanie go.
Tak więc, sztuczna inteligencja, no cóż, ciągle słyszymy o uczeniu maszynowym i sztucznej inteligencji i „Och, czy to nie rozwiąże wszystkich tych problemów?” Robin i ja słyszeliśmy od lat o samodostrajających się bazach danych i tych wszystkich zabawnych rzeczach - dzieje się trochę, ale po prostu zadaj sobie pytanie: jak często Siri robi to dla ciebie? Jak często Siri przypadkowo pojawiała się i mówiła: „Przepraszam, nie dostałam tego”. To dlatego, że nie pytałam cię o nic. Po prostu przypadkowo nacisnąłem ten przeklęty guzik. Więc wciąż jest wiele wad, a przy okazji, po lewej stronie, to układ ASIC od Apple Newton - pamiętasz tego szczeniaka sprzed wielu lat? To było jedno z pierwszych inteligentnych urządzeń i to było dawno temu, to tak jak na początku lat 90. lub połowy lat 90., chcę powiedzieć. Że Newton wyszedł i nie był zbyt dobry, ale miał wizję; wiedzieli, dokąd zmierzają, ale nawet teraz, z iPhone'em AI i uczeniem maszynowym, powiedziałbym, że są to bardzo źle rozumiane pojęcia.
I z pewnością w odniesieniu do uczenia maszynowego, może być bardzo przydatne i faktycznie może być używane w niektórych z tych środowisk, w których starasz się zrozumieć, co się dzieje ze złożoną architekturą informacji, w której wszystko idzie źle. Uczenie maszynowe może być bardzo cenne w tym kontekście, ale tylko pod warunkiem zastosowania go w bardzo ostry sposób. Byłem właśnie na wielkim wydarzeniu w Kalifornii, jeden z największych dystrybutorów Hadoop Cloudera miał swój szczyt analityków i rozmawiałem z głównym dyrektorem ds. Strategii i powiedziałem: „Wiesz, wydaje mi się, że tak naprawdę uczenie maszynowe robi tylko dwie rzeczy: dzieli i udoskonala. ”Oznacza to, że da ci różne segmenty lub grupy działań, w tym anomalie, które byłyby segmentem. I udoskonala, co oznacza, że pomaga ci podjąć pewną decyzję. Klasyczny przykład, o którym słyszysz, to na przykład istota ludzka na tym zdjęciu. Jest to coś, co może zrobić uczenie maszynowe, i jest przydatne w pewnych kontekstach, gdy mówisz o rozwiązywaniu problemów, ponieważ możesz szukać wzorców zachowania w zakresie wykorzystania procesora, zużycia pamięci, szybkości dysku i tego, co robią dyski i wszystkie tego rodzaju zabawne rzeczy. Może to być przydatne, ale tak naprawdę musi być bardzo skoncentrowane, aby wygenerować dowolną wartość.
Tak więc, jedną z moich ulubionych rzeczy do omówienia - i myślę, że zobaczymy trochę tego, kiedy weźmiemy dziś nasze demo z IDERA - pod wieloma względami myślę, że ludzie wciąż uczą się mówić krzemem . Pod tym wszystkim kryje się materiałoznawstwo, a ci z was, którzy rozwiązywali problemy i naprawdę uważnie przyglądali się złożonej architekturze informacji, kiedy próbują zrozumieć, co się dzieje, nawet na przykład w klastrze Hadoop, naprawdę zwykle patrzysz tylko na histogramy. A potem musicie skorelować, co te różne histogramy oznaczają w danym momencie, a to wymaga inteligencji; która wymaga ludzkiej inteligencji i doświadczenia. Nie obawiam się więc, że ML, uczenie maszynowe lub sztuczna inteligencja zamierzają w najbliższym czasie odebrać zbyt wiele miejsc pracy na tym świecie. Myślę, że zawsze będzie potrzeba ludzi, którzy szczerze wiedzą, o czym mówią, aby nam pomóc i sprawić, aby to wszystko się stało.
Ruszajmy więc dalej. Co się stanie, jeśli nie będziesz sterowany danymi? To słynny obraz, „Ślepy wiodący niewidomych” - nie tego szukacie, ludzie. Nie chcesz tego rodzaju środowiska w swojej organizacji. Chcemy, aby nasze decyzje opierały się na danych i chcemy, aby decyzje były podejmowane przez dobre dane, dane dobrej jakości, a stanie się to tylko wtedy, gdy zbierzesz prawidłowe dane, jeśli są ładne i czyste, i jeśli Twoje systemy działają poprawnie, jeśli twoje systemy BI są zdrowe, twoje systemy analityczne są zdrowe, a użytkownicy otrzymują to, czego chcą w odpowiednim czasie.
W związku z tym zamierzam zakończyć i przekazać niepowtarzalny Robin Bloor. Robin, zabierz to.
Robin Bloor: Dobra, dziękuję za podanie mi piłkę. Myślałem, kiedy mówiłeś, Eric, myślałem tylko o BI, a ostatnio była prezentacja dostawcy, na której ktoś ostatnio zauważył, że ktoś zauważył, że u konkretnego dostawcy, działającego w określonym systemie w dużej, złej hurtowni danych, zrobiliby to w danym momencie może wykonać 70 000 transakcji BI, które doprowadziłyby do przedstawienia informacji wielu osobom. Przyszło mi do głowy, że jeśli faktycznie masz tego rodzaju obciążenie, a nawet marnujesz kilka sekund na wykonanie oprogramowania, to tak naprawdę będzie to bardzo drogie, a jeśli stracisz minuty, będzie okropnie drogie. A potem przypomniałem sobie, że okropna część świata działa na arkuszach kalkulacyjnych - są, myślę, że nazywano je „systemami cieni”, prawda? Po pierwsze, gdy ludzie po prostu składali systemy za pomocą arkuszy kalkulacyjnych i poczty e-mail, i sprawiali, że coś się działo, ponieważ dział IT nie może tworzyć aplikacji dla wszystkich, więc oni to robią. I tak myślę, że wiele BI angażuje się w takie systemy.
W każdym razie, powiedziawszy to, zacznijmy mówić o tym, o czym zamierzam mówić. BI to pętla zwrotna dla systemów korporacyjnych, jest naprawdę tak prosta lub skomplikowana, w zależności od tego, jaką rolę odgrywa ona w organizacji. Ale jeśli spojrzymy na to, to schemat sprzed około czterech lat, kiedy próbowaliśmy w taki czy inny sposób zrozumieć, co dzieje się po stronie analityki. Ale właściwie wszystko, co jest z perspektywy czasu, patrząc wstecz na to, co się wcześniej wydarzyło, i wszystko, co jest niedopatrzone, jeśli chodzi o sposób działania systemu, wydaje się być BI. Nie było tak, że to, co było prognozowaniem, analityką predykcyjną było BI, ale tak naprawdę coraz częściej tak jest. Eric wspomniał o uczeniu maszynowym, wiele uczenia maszynowego może faktycznie działać w taki czy inny sposób po prostu w oparciu o strumień danych i może zapewniać analizy predykcyjne na nadchodzące pięć minut, a nawet prawie w czasie rzeczywistym, dzięki czemu można odpowiedzieć klient z wyliczoną wiedzą o tym, co się faktycznie dzieje.
Ale w centrum tego diagramu, wnętrze pochodzi z analizy. Zwykle dzieje się tak, że różne działania analityczne są wskazywane na poszczególne kolekcje danych i uczy się czegoś nowego, uczy się wiedzy na temat biznesu. Ta wiedza jest następnie powiązana z procesami biznesowymi, które mogą z niej czerpać. I zwykle manifestuje się w ten czy inny sposób, gdy pojawiają się alerty BI, lub po prostu różne rzeczy umieszczane na deskach rozdzielczych, i tak dalej. Kiedy to zrobiliśmy, są tam cztery terminy, które kończą się słowem „wzrok”, co jest bardzo miłe. Ale w rzeczywistości nie jest to wszystko, co ludzie chcą robić, jest też problem optymalizacji i optymalizacja nie daje prostych analiz. Jest to bardzo złożony problem, a wiele problemów związanych z optymalizacją nie jest jednoznacznie rozwiązanych. Możesz mieć tylko dobre rozwiązania, nie możesz udowodnić, że masz lepsze rozwiązanie. I to jest obszar działalności, w którym trwa aktywność, ale jest to mniej niż większość innych obszarów analizy. Ludzie mówią, że żyjemy w erze analizy - no cóż, robimy to w porównaniu do dziesięciu lat temu, ale może pójść znacznie dalej, niż już minęło.
Tak więc zapoczątkowanie BI, chęć wiedzy rodzi prośby użytkowników, które rodzą projekty analityczne, a projekty analityczne rodzą jeziora danych, jeziora danych oraz analizy rodzą wgląd i spostrzeżenia. To właśnie opowieść; Pomyślałem, że to wypiszę. Chodzi mi o to, że sedno tego slajdu i większość innych slajdów ma na celu podkreślenie, jak bardzo złożony jest świat wywiadu gospodarczego. To nie jest prosta sprawa, mógłbym sprawić, by ten konkretny slajd był bardziej skomplikowany niż jest w rzeczywistości, ale na dole masz dane zewnętrzne i wewnętrzne, które w ten czy inny sposób zostaną wprowadzone w scenę obszar, który obecnie jest rodzajem jeziora danych, chociaż nie wszyscy mają jeziora danych. I ludzie, którzy niekoniecznie odnoszą sukcesy. A potem istnieje potrzeba czyszczenia danych i działania zarządzającego na danych, zanim będzie można naprawdę z nich skorzystać. Następnie podajesz te dane i albo je raportujesz, albo analizujesz, a analiza prowadzi do działania.
A jeśli spojrzysz na różne rodzaje analiz, które istnieją, jest to niesamowicie długa lista, ale niekoniecznie jest to kompletna lista, to jest to, co pomyślałem, aby zapisać, kiedy faktycznie tworzyłem ten slajd. Tak więc w środowisku BI dzieje się wiele rzeczy, w tym wizualizacje, OLAP, zarządzanie wydajnością, karty wyników, pulpity nawigacyjne, różne rodzaje prognoz, jeziora danych, eksploracja tekstu, eksploracja wideo, prognozy, istnieje szerokie spektrum rzeczy, które faktycznie trwa. Jeśli spojrzysz na to inaczej, rzeczywistość korporacyjna, tak naprawdę jest to schemat podobny do poprzedniego, to po prostu zrobione w inny sposób. Oddzieliłem to, co nazwałbyś BI, ponieważ jest to regularne i wiadomo, co jest wymagane, co nie oznacza, że to, co się faktycznie dzieje, jest wydajne, ale przynajmniej będziesz mieć normalne rzeczy, na przykład w Tableau, w Click lub w Cognos, istnieje źródło tematyczne i tak dalej itd., Będą się pojawiać różne regularne raporty lub możliwości. A potem masz aplikacje analityczne i są różne. Ponieważ aplikacje analityczne naprawdę dotyczą eksploracji danych i moim zdaniem to w pewnym sensie równoznaczne z badaniami i rozwojem. A potem masz przepływ pracy. W ramach przepływu pracy pomieszaj swoje rzeczy z aplikacjami operacyjnymi i aplikacjami biurowymi, jeśli to konieczne - i taka jest rzeczywistość korporacyjna, jaką widzę - chociaż w większości organizacji nie jest tak dobrze zorganizowana.
Zakłócenie BI, to tylko zestaw rzeczy, o których należy wspomnieć, sprawia, że BI jest trudniejsze niż kiedyś, ponieważ stary świat BI składał się głównie z dość czystych zestawów danych przechwytywanych w taki czy inny sposób, prawdopodobnie z hurtowni danych i wprowadzanych do określonych Oprogramowanie BI. W tamtych czasach naprawdę rozmawiam pięć czy dziesięć lat temu, ale w tamtych czasach wolumeny danych nie rosły, źródła danych były znane. Szybkość dostarczania danych była znana, chociaż często niektóre BI nie działały wystarczająco szybko, aby zadowolić niektórych użytkowników. Nie było żadnych nieustrukturyzowanych danych, prawie nie było danych społecznościowych, z pewnością żadnych danych IoT, nie dbałeś o pochodzenie danych. Wartość komputerowa nie miała paralelizmu pod względem infrastruktury, aby móc w ten czy inny sposób robić rzeczy wyjątkowo szybko. Nie miałeś uczenia maszynowego, a liczba obciążeń analitycznych była dość niewielka. I to wszystko się zmieniło, ilość danych może teraz bardzo wzrosnąć. Liczba źródeł danych ciągle rośnie. Tak, przesyłanie strumieniowe danych bardzo szybko, wiele nieustrukturyzowanych danych, z pewnością dane społecznościowe, które będą wymagać oczyszczenia, ale inne dane, które mogą wymagać oczyszczenia, z pewnością dane IoT, są teraz rozwiązaniem.
Pochodzenie danych jest problemem i zależy nam na tym. Jest tam moc komputera, co jest porządne, ponieważ sprawia, że wszelkiego rodzaju rzeczy są wykonalne, a teraz masz uczenie maszynowe jako zjawisko, które prowadzi do tworzenia większej liczby możliwości BI i nowych obciążeń analitycznych, które zrobią to samo. Zatem BI nie jest sytuacją statyczną i myślę, że to ostatnia rzecz, którą powiem, zanim przekażę ją Stanowi. O nie, nie jest, jest coś jeszcze. Przyszły krajobraz BI, internet przedmiotów, architektury oparte na zdarzeniach, wszystko w czasie rzeczywistym, OK. To wystarczy BI dla użytkownika, przez użytkownika, dla użytkownika w podsumowaniu problemów. Terminowość wydajności przepływu danych, zakres danych, czyszczenie danych, umiejętności dostępu do danych, wizualizacja, możliwość udostępniania i akcji.
Teraz mogę przekazać ją Stanowi, chyba że usługa BI jest niezawodna i terminowa, nie jest to usługa. Stan?
Eric Kavanagh: Dobra, Stan, daję ci piłkę, zabierz ją.
Stan Geiger: OK. To, o czym zamierzam mówić, to tylko moje pochodzenie. Jestem starszym menedżerem w firmie IDERA w zakresie zarządzania produktami, a jednym z moich obowiązków jest oferowanie produktu przez naszą wywiadownię gospodarczą. Więc zamierzam trochę rozwinąć to, o czym mówiła Robin i porozmawiać o kluczowym obszarze z wywiadem biznesowym, jakim jest monitorowanie stanu twojej platformy. To tak, jak powiedział, teraz było to miejsce, w którym mieliśmy wszystkie te dane, a analiza zajęłaby tygodnie, a potem wrócilibyśmy z raportami i innymi rzeczami. Ale krajobraz BI zmienia się tak, że zbliżamy się teraz do analizy niemal w czasie rzeczywistym. W wielu przypadkach rzeczywiste analizy w czasie rzeczywistym. Mówię więc trochę o tym slajdzie, jest to tylko przegląd - i tak jak w przypadku pełnego ujawnienia, zamierzam porozmawiać o tym z perspektywy Microsoft, ale wszystkie te koncepcje dotyczą tego, czy Twoja BI platformy są w Oracle lub korzystasz z Informatica i Oracle lub po prostu mieszasz środowiska hybrydowe. Użyję tylko w odniesieniu do środowiska Microsoft, ale jest to dość standardowy.
Robin miał slajd, w którym poruszono to, że masz systemy źródłowe, w których mam wszystkie moje dane, a teraz były to wszystkie relacyjne bazy danych i takie przechowywanie danych, ale teraz mamy Hadoop, Internet i inne rzeczy, i wszystkie te nieustrukturyzowane dane siedzące tam, i możemy teraz wprowadzić je do tej architektury BI. Więc środkowy poziom mówi trochę, to gromadzenie danych w agregacji; w tym miejscu pobieramy dane, możemy je wyczyścić, możemy je zrestrukturyzować, a następnie umieścić jakiś rodzaj magazynu danych, a następnie warstwa prezentacji znajduje się na nim i tam właśnie uzyskują dostęp twoi użytkownicy. Robimy analizy tych danych w tych magazynach danych, robimy pulpity nawigacyjne, a Tableau tam siedzi, usługi raportowania i tym podobne. Zawsze się śmieję, ponieważ kiedy byłem architektem licencjackim, zawsze śmialiśmy się z Excela, bo spójrzmy prawdzie w oczy, Excel jest nadal narzędziem BI dla mas.
Oto krótki przegląd, ale aby porozmawiać o architekturze platformy, masz dane źródłowe, a ja mówiłem o tym w wielu magazynach danych. A potem mam swoją pamięć masową w świecie Microsoft, będziesz mieć swoją bazę danych SQL Server, może tam, gdzie jest twoja hurtownia danych, możesz mieć swoją hurtownię danych w chmurze, jako hurtownię danych. Masz usługi analityczne, które są twoimi rurkami OLAP i takimi rzeczami do tworzenia agregacji i różnych rzeczy dookoła, patrząc na rzeczy w wielu wymiarach i tym podobne. Potem masz swoją warstwę prezentacji, o której krótko mówiłem, o wszystkich tych rzeczach, które leżą na szczycie tych magazynów danych i agregacji. I zawsze podoba mi się ten cytat „Nie wiesz, czego nie wiesz”, co jest prawdą. Jeśli nie monitorujesz i nie patrzysz na to, co się dzieje, na wszystkich tych obszarach platformy BI, skąd masz wiedzieć, kiedy masz problem, inny niż kiedy użytkownicy zaczynają wysyłać ci nieprzyjemne e-maile i telefon się uruchamia dzwoni o tym, dlaczego moje raporty nie są wyświetlane? Dlaczego wszystko trwa tak długo?
W związku z tym, co musisz zrobić, musisz być w stanie monitorować swoje platformy, z których służysz wywiadowi gospodarczemu. Zasadniczo podzieliłem to na trzy obszary: masz dostępność, wydajność i wykorzystanie. Dostępność oznacza, czy zasób jest dostępny: czy jest w górę, czy w dół? Całkiem proste. Ale patrząc również na to, kiedy masz, platforma może być dostępna, ale możesz mieć problemy, więc musisz mieć możliwość identyfikacji przyczyn źródłowych; musisz mieć możliwość ostrzegania i powiadamiania kogoś o tym, co się dzieje, zanim sytuacja stanie się krytyczna. To prowadzi również do strony wydajności, ponieważ masz rzeczy z poziomu metryki wydajności, na poziomie serwera, na którym hostowane są usługi lub usługi BI lub platformy BI; masz wydajność na poziomie zasobów, gdzie może na przykład uzyskuję dostęp do danych z sieci SAN. SAN jest zasobem, zasobami sieciowymi, musisz być w stanie monitorować wydajność tego wszystkiego, aby móc identyfikować wąskie gardła i dbać o zadowolenie użytkowników, a jeśli jesteś w środowisku, w którym robisz prawdziwe- czas analizy, musisz być w stanie zidentyfikować wąskie gardła lub problemy, zanim zaczną się pojawiać.
A ostatnią teorią jest wykorzystanie: co robią użytkownicy? Kto jest podłączony do moich źródeł BI? Kto co prowadzi? Jakie zapytania są uruchomione? Jakie raporty są uruchomione? Znajomość tych informacji pomaga na przykład określić i wykonać planowanie wydajności. Pokazuje także, co jest wykorzystywane w twoim środowisku BI. Mieliśmy klienta, który potrzebował naszego produktu do monitorowania BI, aby wiedzieli, z jakich części środowiska BI korzystają, aby mogli przenosić zasoby. Na przykład, jeśli nie korzystaliby z niektórych raportów lub pewnych kostek usług analitycznych, wówczas przenosiliby zasoby z tego do innych obszarów, które były intensywnie wykorzystywane. Kolejny cytat, który mi się podoba, lubię naprawdę świetne filmy, takie jak „Drżenie”, więc opowiedzcie mój film, więc podoba mi się ten cytat Burt Gummer, w którym grał Michael Gross, jest on typem rewolwerowca i mówi: pojawia się i wyciąga ten wielki karabin snajperski kalibru 50, a jeden z facetów mówi: „Cholera, Bert”. A on odpowiada: „Kiedy go potrzebujesz, a go nie masz, śpiewasz inną melodię. ”Innymi słowy, wiesz co? Był przygotowany na wszystko i przyszedł przygotowany na wszystko, więc mam na myśli to, że jeśli nie monitorujesz swojego środowiska BI pod kątem zasobów i wykorzystania oraz rzeczy, o których właśnie mówiłem, to nie zdajesz sobie sprawy, że potrzebujesz narzędzia lub środowisko lub struktura, które go monitorują, dopóki go nie masz. I wtedy zdajesz sobie sprawę, że naprawdę potrzebowałem tego, by iść naprzód, i tak właśnie jest w przypadku wielu naszych klientów.
Powiedziawszy to, przeprowadzimy się i przyjrzymy się temu, co robimy tutaj w IDERA, aby rozwiązać niektóre z tych problemów. I-
Eric Kavanagh: Dobra, proszę bardzo, rozumiem.
Stan Geiger: Widzisz to? W porządku. To, co mamy tutaj, to nasz produkt BI Manager. I monitorujemy, IDERA tradycyjnie była firmą w środowisku SQL Server, Microsoft SQL Server. A potem kupiliśmy w Embarcadero, więc teraz rozszerzyliśmy się na inne platformy, ale nasz produkt BI tradycyjnie monitoruje stos BI w środowisku Microsoft. Byłyby to usługi analityczne dla Twojej wielowymiarowej i tabelarycznej analizy, usługi raportowania, narzędzie raportowania, a następnie usługi integracyjne, które są platformą ETL, podobną do podobnej do Informatica.
Dzięki naszemu produktowi możesz monitorować wszystkie trzy środowiska za pomocą jednego produktu, a to, co tutaj widzisz, to ogólny pulpit nawigacyjny, a rzeczą, na którą warto zwrócić uwagę, gdy mówiłem o tym, ostrzegając, jest jedna rzecz do monitorowania, ale to nie wystarczy - musisz mieć mechanizm ostrzegawczy. Innymi słowy, muszę być powiadamiany, zanim sprawy staną się krytyczne. Tak więc, tutaj robimy, istnieje cały zestaw danych, które przechwytujemy, które można konfigurować, ponieważ w zależności od środowiska, określonych progów, możesz mieć czas na odczyt w twoim środowisku z trzydziestoma milisekundami. W innych środowiskach bardziej krytyczne może być obniżenie tego progu, dlatego ważne jest nie tylko ostrzeganie, ale także konfigurowanie go, ponieważ środowiska różnią się w zależności od zasobów.
Zasadniczo jest to przegląd wszystkich monitorowanych tutaj środowisk i mam tutaj trzy instancje: jedno dla usług analizy, jedno dla usług integracji, jedno dla usług raportowania. Widzisz, mam tu kilka powiadomień. A ponieważ są czerwone, mówi mi, że są one krytyczne, ponieważ mam wiele poziomów, na których mogę ustawić te alerty, a alerty można wysyłać pocztą e-mail do osób odpowiedzialnych za zbadanie problemu. Więc krótko przyjrzymy się i wrócę do alertów, abyśmy mogli przejść do działu usług analitycznych i jestem pewien, że czeka na załadowanie tutaj. I w zasadzie to, co robimy, gromadzimy dane; wychodzi tam okresowo i tam wychodzi i zbiera i miga tego, co robią twoje środowiska. Tak więc mam mój zestaw co sześć minut, więc co sześć minut wychodzi i sonduje środowisko. Przez pewien czas miałem moją maszynę wirtualną, więc powrót do niej zajmie chwilę. No to jedziemy.
Rzucamy okiem na część usług analitycznych, więc kliknę tutaj moją instancję i pamiętam, że mówiłem o jednej z rzeczy, które monitorujemy, to wydajności na poziomie serwera, ponieważ wiele osób ma wiele rzeczy działa na ich serwerze. Mogę mieć bazę danych uruchomioną na moim serwerze, a także na przykład usługi analityczne. Więc jeśli coś dzieje się w bazie danych lub mam problem na poziomie serwera, wpłynie to na wszystko, co tam działa. Tak więc będziemy monitorować różne rzeczy na poziomie serwera, takie jak wydajność dysku, i widać, że przechwytujemy dane dotyczące tego wszystkiego. A wszystko to można konfigurować. I patrzę na to, co się dzieje, pod względem procesora, tylko i znowu, to jest na poziomie serwera, a nie na poziomie usług analizy w moim przykładzie tutaj. Ale tak naprawdę na poziomie serwera.
I mogę patrzeć na takie rzeczy jak pamięć, ogólne użycie pamięci, na przykład, co jest dostępne? Teraz mam pojęcie o tym, jaki jest stan samego serwera. Następnie możemy zacząć przyglądać się konkretnym rzeczom, w tym przypadku usługom analizy. Mogę na przykład patrzeć i sprawdzać, jak przebiega moje przetwarzanie kostek, co daje mi miarę zdrowia. Jeśli zacznę dostrzegać, że przetwarzanie trwa dłużej lub nie wiersze nie są pisane tak szybko, to mogę zacząć patrzeć - i to dotyczy fragmentu korelacji, o którym, jak sądzę, mówił Robin, to, że człowiek nadal musi to wszystko zrobić. Mówimy o sztucznej inteligencji, uczeniu maszynowym, ale wciąż potrzeba człowieka, aby móc skorelować te zdarzenia z innymi. Możemy rzucić okiem na to, co się dzieje, jeśli chodzi o zapytania, jakie zapytania są uruchamiane i jak długo one trwają? Potrafię sortować, dzięki czemu mogę dowiedzieć się, które zapytania zajmują najwięcej czasu. Możesz rzucić okiem na upływający czas, mogę rzucić okiem i zobaczyć OK, co to było za zapytanie i kto je wtedy uruchomił?
Więc mogę zacząć opowiadać o tym, o ile widzę, jak rzeczy zaczynają się poprawiać, mogę wrócić i zobaczyć, co robili użytkownicy w tym momencie. Zobaczysz jedną z rzeczy, które robimy, to umieszczenie tutaj selektora czasu, abyś mógł wybrać przedział czasu. Na przykład mogę wrócić do tych alertów, a tak naprawdę był to link do tych alertów, które klikam, i zajmie mi to moment, w którym ten alert się pojawi. A potem mogę zacząć układać historię razem, widzę, no cóż, odczyty dysku były w górę, problemy z pamięcią lub cokolwiek, a następnie mogę przeskoczyć aktywność zapytania w tym samym momencie i faktycznie mogę zacząć korelowanie, kto uruchamiał zapytania, które mogły spowodować te gwałtowne wzrosty. A potem możesz zacząć robić rzeczy takie jak ja, mogę zacząć strojenie, to wtedy zaczynam strojenie. To jest jak samochód, jeśli zbudujesz samochód wyścigowy i po prostu upuścisz silnik i uruchomisz kluczyk, silnik może się uruchomić, ale jeśli muszę wygrać 180 mil na godzinę, aby wygrać, muszę wiedzieć, że silnik może pracować 100 mil na godzinę i muszę tam wejść i zacząć dostrajać ten silnik, żeby móc się tam dostać. I to właśnie pozwala ci to zrobić, to być w stanie dostarczyć ci wystarczającej ilości informacji, aby zacząć dostrajać swoje środowisko, zwiększyć zdrowie i produkcję tego środowiska oraz wydajność.
Następnie monitorujemy w pamięci różne elementy, szczególnie w przypadku usług analitycznych. I tutaj możesz zacząć widzieć, gdzie rzeczy mogą zacząć się nie układać, kiedy zaczniesz widzieć, że rzeczy przekraczają granice pamięci, takie rzeczy. Inną rzeczą, na którą warto spojrzeć, za każdym razem, gdy uruchamiasz dowolny rodzaj zapytań, chcesz, aby dane były buforowane, ponieważ gdy są buforowane, są w pamięci i nie muszą czytać z dysku, co jest znacznie więcej wydajniejsze niż konieczność odczytu danych z dysku. Więc możesz zacząć patrzeć na to, co się dzieje, przepraszam, na przykład w buforze danych. Miałem wcześniej uruchomionych kilka zapytań, aby uzyskać te dane, i widać, że miałem większość czasu, trafienia do pamięci podręcznej i wyszukiwania pokrywają się, co jest dobre. Ale miałem okres, w którym liczba trafień była znacznie niższa niż liczba wyszukiwań, co mówi mi, że miałem coś, co wymagało dużej ilości pamięci, tak że pamięć podręczna była opróżniana znacznie szybciej, więc dane musiały być czytać z dysku. Widzimy to, gdy spojrzymy na silnik pamięci masowej. Jest to ten sam moment w czasie, co na tym innym wykresie i widać tam skok, w którym zapytania z pliku naprawdę podskakiwały w tym okresie. A to oznacza, że dane były odczytywane z dysku. Teraz mogę cofnąć się, a następnie skorelować to z działającymi zapytaniami i nie powodować krwawienia uszu wszystkich, ale w usługach analitycznych używa języka o nazwie MDX, istnieją sposoby na bardziej wydajne pisanie zapytań, więc używa pamięci podręcznej bardziej wydajnie i mniej pamięci. Jest więc przykład dostrajania tego silnika i zapewniania wszystkich elementów potrzebnych do skorelowania tego.
Po prostu możemy odwrócić to w drugą stronę, kiedy patrzymy na zapytania, możemy teraz spojrzeć na sesje, kto w tym momencie jest połączony i na czym one działają? Ten rodzaj daje przeciwny widok zapytań i kto je uruchamia. To jest ten, kto jest połączony, a następnie mogę zobaczyć, co oni aktualnie działają. Inną rzeczą, aby szybko przejść, jest to, że możesz zobaczyć wszystkie obiekty w moich wielowymiarowych kostkach MOLAP. I mogę uzyskać informacje na ten temat. Na przykład mogę sortować według tej kolumny odczytu i widzę, że najczęściej wykorzystywanym obiektem jest wymiar czasowy, a drugim najczęściej używanym jest wymiar klienta. A to pomaga ludziom, którzy rozwijają i budują rzeczy, aby bardziej efektywnie budować swoje kostki. Mogę chcieć zmienić strategię partycjonowania danych, na przykład, na te często używane wymiary w mojej kostce, a zatem na przykład zwiększy to wydajność zapytań. Może to obniżyć wydajność przetwarzania kostki, ponieważ teraz mam więcej partycji, ale z perspektywy użytkownika dostroi ten silnik, aby był bardziej wydajny w wykorzystaniu tych obiektów.
Przejdźmy dalej, porozmawiajmy o usługach integracyjnych tutaj. Usługi integracji, o których wspomniałem, to platforma ETL w środowisku Microsoft. To, co tu robimy - i jest to spójne - monitorujemy wydajność serwera, a my sprawdzilibyśmy te same wskaźniki, ponieważ wszystkie moje usługi działają na tym samym serwerze. Ale znowu jest to przegląd tego, co dzieje się na serwerze. A potem mogę przyjrzeć się działalności usług integracyjnych, moich procesów ETL. Mogę więc zorientować się, kiedy te procesy zostały uruchomione, czy zakończyły się sukcesem, czy nie. Mogę wyróżnić konkretny przebieg procesu ETL, a następnie pokaże mi podział kroków w tym procesie ETL, czy zakończyło się ono sukcesem czy nie i jak długo to trwało.
Teraz, gdybym miał tutaj nieudany proces ETL, mógłbym przejść do szczegółów i zobaczyć komunikat o błędzie i pokazałby mi, który krok w tym pakiecie nie powiódł się ten proces ETL, wraz ze wszystkimi komunikatami z tym związanymi. To, co to robi, daje mi i mogę otrzymać alert, jeśli się nie powiedzie, więc jeśli dostanę alert, mogę wejść tutaj, zobaczyć, przejść do tego alertu, zobaczyć awarię pakietu, spojrzeć na kroki, zobacz, gdzie się nie powiodło, spójrz na komunikat o błędzie i od razu wiem, co muszę zrobić, aby to naprawić: ponownie wdróż go, a następnie uruchom ponownie. To, co pozwala ci to zrobić, polega na skróceniu tego okna między identyfikacją problemu a rozwiązaniem problemu. Tak więc w poprzednim życiu, kiedy byłem odpowiedzialny za tego rodzaju rzeczy, mieliśmy proces ETL, który działałby w nocy, aby załadować naszą hurtownię danych. Gdybym miał te informacje, pierwszą rzeczą rano, kiedy przyszedłem, jeśli coś się nie powiedzie, mogę szybko rozwiązać ten problem i przywrócić ten proces, aby upewnić się, że hurtownia danych była uruchomiona i odświeżona do czasu, gdy użytkownicy wszedł i zaczął uzyskiwać dostęp do raportów.
Inną rzeczą jest to, że mam uruchomione dwa procesy, to spojrzeć i zobaczyć, jak przebiegało w czasie. To ważne, ponieważ jeśli zacznę widzieć te procesy, na przykład potrwać dłużej, widząc, jak te czasy się nasilają, być może będę musiał spojrzeć na przykład na moje okno konserwacji, mogę mieć rzeczy, które działają na tym serwerze . Weźmy na przykład kopie zapasowe; Być może trwa tworzenie kopii zapasowej, co powoduje, że mój proces musi czekać na zakończenie. Być może będę musiał zmienić harmonogram lub żonglować procesami wokół rzeczy, które zaczynają mieć wpływ na mój ETL.
Ostatnim elementem są usługi sprawozdawcze. Usługi raportowania to narzędzia firmy Microsoft, w zasadzie ich narzędzie do raportowania dla przedsiębiorstw. I niektóre rzeczy, znowu, możemy patrzeć na rzeczy na poziomie serwera, możemy patrzeć na rzeczy na serwerze raportów, serwerze usług raportowania, samym w sobie. Nie mam tu wielu rzeczy; Mam kilka subskrypcji, które działają co 15 minut, aby uruchomić raport. Tak więc nie zobaczysz wielu aktywnych połączeń, ponieważ się włącza, łączy, uruchamia raport, rozłącza się i wysyła.
Ale w środowiskach o wysokim poziomie transakcji, w których odbywa się wiele raportów, kluczową kwestią jest możliwość monitorowania tych rzeczy. Możesz więc zobaczyć, gdzie się tu działo, dzięki czemu masz całkiem niezłe wyobrażenie o tym, co dzieje się na poziomie usług i platformy. A potem, o czym mówiłem na slajdach, to kto jest kim i co robi? Jeden z naszych klientów kupił ten produkt właśnie dla tego produktu, ponieważ chciał wiedzieć, jakie raporty są wyświetlane przez ludzi i kto je wyświetlał. Jest to jedna z rzeczy w tym raporcie, którą możesz zobaczyć tutaj. Widzę jaki raport, widzę wszelkie parametry, które były w tym raporcie, widzę, kto go uruchamia, widzę format raportu. A potem mam wszystkie te dane, więc jeśli znowu, mogę uszeregować te rzeczy, na przykład, jaki raport najdłużej zajęło pobranie danych, i mogę przejść od razu do tego i zobaczyć, który to raport. I znowu to wszystko daje mi dane, aby ponownie dostroić ten silnik. Teraz mogę zacząć dostrajać swoje środowisko raportowania.
I na koniec, czy mogę rzucić okiem na aktywność użytkownika, z kim ponownie się łączy, co oni robią? Mogę w rzeczywistości, w środowisku, w którym miałem wielu użytkowników, wszystkie te są sortowalne, dzięki czemu mogę rankingować, widzę, kto najbardziej korzysta ze środowiska. Tak więc, aby szybko wrócić i przejrzeć te alerty. Oto ostrzeżenie; Mogę kliknąć ten link tutaj, a on zabierze mnie do wykresu w tym momencie i pokaże, który z nich był w pogotowiu. Widać tutaj, to właśnie dlatego, że były to średnie milisekundy na zapis, na przykład odczyt i zapis. Więc znowu, po prostu próbuję uzyskać punkt identyfikacji problemów. I naprawdę ważne jest, aby mieć holistyczne narzędzie, a nie tylko coś, co patrzy na to jedno, ponieważ człowiek musi tu wejść i skorelować wydarzenia, które się dzieją, więc musisz być w stanie spojrzeć na to, co się dzieje punkt w czasie w wielu obszarach tego środowiska, i to jedna z rzeczy, które robimy za pomocą tego selektora czasu tutaj.
Eric Kavanagh: Tak, to jest Eric tutaj z szybkim pytaniem, bo myślę, że prawdopodobnie uderzyłeś się w głowę i o tym właśnie mówiłem w szczycie godziny, że człowiek musi przyjść i narysuj te korelacje między różnymi środowiskami. Ciekawe, czy jest jakiś materiał edukacyjny, którym możecie się podzielić, czy może angażujecie się w ludzi, aby pomóc im zidentyfikować niektóre z tych wzorców? Tak jak przed chwilą miałeś naprawdę dobry przykład, o tym, kiedy jeden z nich przyspiesza, co mówi ci, że coś dzieje się w pamięci, ponieważ próbowało zrzucić pamięć. I daje ci to wskazówkę, ale jak ludzie porównują te statystyki do rzeczywistych problemów, to prawdziwe pytanie.
Stan Geiger: Tak, to dobra rzecz i jedna z rzeczy, o których właśnie mówiłem, mapa drogowa produktu, to w tym roku wydamy wersję i jedną z rzeczy, które zamierzamy zacząć dodawać jest na każdym z tych wykresów, jest opisem tego, co oznacza ten wykres i dlaczego powinieneś się tym przejmować oraz jaki to ma wpływ. Możesz więc kliknąć znak zapytania lub coś na tym wykresie, a następnie otworzyć okno, które dostarczy ci dużo tych informacji i powie, że są to możliwe przyczyny, są to obszary, na które wpływ ma wpływ, i poprowadzi Cię jesteś w kierunku, by móc iść w tym przypadku, jak powiedziałeś, oto ten skok, wiem z własnego doświadczenia, co to oznacza. A potem mogę zacząć iść i zacząć wiercić w obszarze i znaleźć przyczynę.
Teraz mamy wiele tego, w rzeczywistości, w naszym menedżerze diagnostycznym dla SQL Server, dla rzeczywistej bazy danych. Mamy wiele tego typu funkcji w takim produkcie, a także mamy pewne analizy analizy dla menedżera diagnostycznego, które podążają za tobą znacznie szybciej. I właśnie tam idziemy z tym produktem.
Eric Kavanagh: I zgaduję, że istnieją sygnatury niektórych rodzajów działalności. Czy to narzędzie pozwala zidentyfikować, kiedy miało miejsce określone zdarzenie, i skatalogować je, aby z czasem rozpoznał podobny wzorzec i pomógł dowiedzieć się, czy może to być nowy użytkownik, na przykład za pomocą to samo narzędzie? Pomóżcie zrozumieć, och, to dlatego, że te serwery się zepsuły lub ten region upadł? Czy istnieje jakiś sposób na katalogowanie sygnatur problemów, które można łatwo zidentyfikować później?
Stan Geiger: Nie, tak naprawdę, ale to jest naprawdę ciekawa koncepcja, ponieważ jest prawie taka, jak to jest - chyba podstawowa analiza komponentów - gdzie identyfikujesz wzorce i logujesz te wzorce, więc jeśli zobaczysz je ponownie, możesz wrócić i zobaczcie, OK, to była przyczyna w tym momencie. Tak, to coś, czego nie ma na mapie drogowej, ale o czym myślałem z punktu widzenia zarządzania produktem.
Eric Kavanagh: Mogę sobie wyobrazić. Och, śmiało.
Stan Geiger: Nie, chciałem powiedzieć - i otrzymujemy wiele próśb, ponieważ nie wiem, jakie jest twoje doświadczenie - ale widzimy, że DBA znają bazy danych takie jak ich ręka, ale informacje BI coś w rodzaju czarnej skrzynki, jeśli chodzi o zdrowie platformy. I nie ma, nie mają wokół tego dużej wiedzy. Tak, po prostu pracowałem w nim od pięciu do dziesięciu lat, prawda? Ale typowi ludzie, którzy są odpowiedzialni za ich znalezienie lub otrzymywanie alertów i zastanawianie się, co się dzieje, to dla nich rodzaj czarnej skrzynki.
Eric Kavanagh: Tak, mogę sobie wyobrazić. Chciałbym też wiedzieć, więc pokazywałeś na tym jednym ekranie, jak możesz zobaczyć wszystkie zapytania, jak długo trwały i kto je wygenerował. Czy widzisz także rzeczywistą strukturę samego zapytania SQL i dokonujesz w związku z tym analizy? Być może czasami ludzie łączą zapytania SQL, które są dość nieporęczne, powiedzmy, i kłopotliwe, w przeciwieństwie do mistrza, który naprawdę łączy fajne, ścisłe zapytanie. Czy jest to coś, co możesz wizualizować za pomocą tego narzędzia, a następnie pomóc ci w tym problem?
Stan Geiger: Tak, więc możesz zrobić, podobnie jak to, co tutaj zrobiłem, to, że właśnie posortowałem, na przykład, upływ czasu. Widzę więc te, które zajęły najdłużej, a potem dostaję tekst, ale to nadal zależy od kogoś, kto jest mniej więcej ekspertem w tej dziedzinie, by spojrzeć na to i powiedzieć: „Och, OK, oto dlaczego to trwało tak długo . ”To coś w rodzaju analizy obciążenia, nazywamy to SQL Workload Analyzer po stronie bazy danych, że oszukiwałam się z pomysłem, że może w przyszłości wymyślę coś podobnego, aby zidentyfikowała te zapytania, a następnie podaje zalecenia dotyczące ich dostrojenia. Ale jednym z problemów jest to, że to zapytanie MDX jest dość wyspecjalizowanym językiem.
Eric Kavanagh: Tak, mogę sobie wyobrazić. Ale możesz na przykład zobaczyć, kim są ludzie, więc nie jest trudno ustalić, czy jedna osoba, jeśli jeden facet jest odpowiedzialny za dziesięć najdłuższych zapytań procesowych, to jeśli nic więcej nie możesz do niego zadzwonić lub zadzwonić jego menedżer lub ktoś i powie: „Hej, ten facet żuje dużo przepustowości”, a może okazuje się, że są to najcenniejsze zapytania dla biznesu, prawda? Musisz umieścić to w kontekście tego, czym jest wartość biznesowa, z samych zapytań nie jest to tylko czysta gra liczbowa, prawda? Żeby się dowiedzieć, cóż, ten facet jest naszym zaawansowanym użytkownikiem i to on zmienia biznes, prawda?
Stan Geiger: Nie, masz całkowitą rację. Mam na myśli, że jest to jeden ze sposobów, w jaki klienci korzystają z tego, aby móc to zrobić. Tak jak powiedziałeś, możesz znaleźć jeden obszar, ponieważ jedną z rzeczy, o których mówię, zawsze żartuję w Excelu, ale możesz połączyć się z usługami analizy w Excelu i uruchomić tabele przestawne poza OLAP, a on generuje własne zapytania i wysyła je, a czasem nie są najlepszą formą, więc możesz wrócić i je zidentyfikować, a następnie przepisać je i dać użytkownikowi, a następnie pozwolić im uruchomić je poza tym miejscem, aby nie zajęło to pół godziny powrócić do tabeli przestawnej.
Eric Kavanagh: Dokładnie. A kiedy mówimy o zapytaniach, obejmujecie całą gamę zapytań, więc wspomnieliście o MDX, a co z niektórymi innymi zapytaniami, takimi jak zapytanie DAX, czy niektóre z tych innych?
Stan Geiger: Tak, omawiamy, tak, każdy DAX i MDX. Więc jedną z rzeczy, o których nie wspomniałem, a może to zrobiłem, ale obsługujemy zarówno tabelaryczny, jak i OLAP w Microsoft i DAX, ponieważ - myślę, że rozmawialiśmy o tym jakiś czas temu - czy widzimy dużo bardziej tabelaryczny teraz niż my OLAP. Ponieważ łatwiej jest przywołać modele tabelaryczne i tego typu rzeczy, więc oczywiście zobaczysz zapytania DAX, ale my również je podamy.
Eric Kavanagh: Tak, to interesujące. Czy masz jakiś kontekst, dlaczego tak się dzieje? Czy może dlatego, że coraz więcej ludzi się w to angażuje i ponieważ OLAP oczywiście nie jest czymś nowym, co istnieje przez co najmniej 30 lat?
Stan Geiger: Racja, cóż, to rodzaj połączenia, jedną z rzeczy jest projektowanie kostek to sztuka. Kostki zostały zbudowane w celu wstępnego agregowania danych, więc wydobycie danych jest naprawdę szybkie, ale przetwarzanie kostki zajmuje trochę czasu, ponieważ musi wykonać wszystkie te agregacje. A potem sprzęt stał się tańszy, a pamięć tańsza, a potem wszyscy wychodzili z kolumnowymi sklepami i bazami danych w pamięci, naprawdę. A także tabelaryczny jest prawdopodobnie najbliższy tradycyjnym relacyjnym bazom danych i jest o wiele łatwiej i szybciej wyświetlać modele tabelaryczne niż w przypadku OLAP. Ale wadą jest to, że rezyduje w pamięci, cała rzecz rezyduje w pamięci, więc zajmuje dużo pamięci, a dane nie agregują, dopóki o to nie poprosisz. Ale powiedziawszy to wszystko, zaczynamy widzieć o wiele bardziej tabelarycznie.
Eric Kavanagh: To interesujące. Może być również dlatego, że ta branża trochę się spłaszcza, a mam na myśli to, że mamy o wiele więcej ludzi, którzy wchodzą w interakcje z danymi i używają różnych narzędzi, a na pewno, gdy mówisz o Microsoft, myślę, że z pewnością jest tak, że masz wielu, dużo więcej użytkowników w małych i średnich firmach, a nawet w niektórych większych organizacjach, które zagłębiają się w to, uzyskują dostęp do narzędzi, uruchamiają zapytania i być może nie są tak dobrze zaznajomieni z cały proces i technologie wokół budowania kostek, do rzeczy, prawda? Bo to wymaga zastanowienia, a także jest drogie, prawda? Budowanie tych kostek zajmuje dużo czasu, chyba że używasz niektórych nowych technologii. Na przykład rozmawialiśmy z firmami takimi jak Snowflake, na przykład, robi całkiem interesujące rzeczy, ale myślę, że masz dużo więcej osób, które używają tych rzeczy i prawdopodobnie używają tego, co właśnie opisałeś, czyli formatu tabelarycznego, w przeciwieństwie do formalnego budowania kostek, prawda?
Stan Geiger: Tak, no cóż, myślę, że Excel - jak sądzę, co to było, Power Pivot, jak sądzę - to w rzeczywistości tabelaryczne, jeśli spojrzysz na to; to sposób budowania modeli tabelarycznych. A potem następna iteracja była taka, że mogę powiedzieć wam, jakie modele tabelaryczne buduję i wdrażam na SQL Server, aby móc udostępniać je wszystkim innym. To prawie naturalne rozszerzenie Excela.
Eric Kavanagh: Tak, to dobra uwaga. To, co widzieliśmy w ciągu ostatnich, powiedziałbym, od pięciu do siedmiu lat, jest po prostu ogromnym rozszerzeniem zastosowania tych technologii, prawda? A Microsoft, szczerze mówiąc, był pionierem w tej dziedzinie, naprawdę demokratyzując dane dotyczące mocy za pomocą usług analitycznych i Power Pivot, prawda? To znaczy, to był przełom w branży, prawda?
Stan Geiger: Tak, nie, masz rację. Mam na myśli slajd, kiedy przedstawiam dłuższą prezentację, która pokazuje przejście od modelu semantycznego, którym był OLAP, do tabeli. I myślę, że mam cytat z Microsoft; chcą danych w rękach użytkowników, a nie tylko na ścianie w sklepie IT, chcą uzyskać więcej danych w rękach ludzi, którzy je zużywają.
Eric Kavanagh: I to wraca do pierwszego bardzo prostego slajdu, który pokazałem, który był podstawowym procesem decyzyjnym dla każdej organizacji, a teraz - i myślę, że to świetna sprawa - pozyskujemy coraz więcej ludzi z całej hierarchii organizacji, zwracając uwagę na to, co się dzieje, przedstawiając ich historię na stole, a ty robisz to z danymi, to podstawowa zasada, to znaczy, możesz użyć innych środków, ale jeśli poprzesz swoją historię danymi, będziesz miał znacznie silniejsze argumenty niż ci, którzy tego nie robią, prawda?
Stan Geiger: Dokładnie tak. Dokładnie tak. Chodzi mi o to, dlatego teraz było tak: „Hej, potrzebuję tego raportu”, więc teraz muszę przejść przez prośbę o raport i muszę przejść tutaj, aby uzyskać mój raport, a teraz mogę usiąść tam, przy biurku i naprawdę, mam dostęp do generowanych danych, podejmuję decyzje biznesowe.
Eric Kavanagh: Zgadza się. Wiesz, wróciłem z konferencji w zeszłym tygodniu i był histeryczny komentarz faceta, który prowadzi raczej duże środowisko BI dla sklepu Target, a on odwoływał się do samoobsługowej analizy i samoobsługowej BI, i oczywiście to duży problem w dzisiejszych czasach. Jestem pewien, że jest to coś, co napędza dużą aktywność w tym, co robicie w IDERA, ponieważ kiedy chcecie wprowadzić samoobsługę, przede wszystkim lepiej mieć zdrowe środowisko BI, prawda? Jeśli masz zamiar zmusić różnego rodzaju ludzi do zadawania wszelkiego rodzaju pytań na różne sposoby, będziesz chciał mieć coś takiego jak to narzędzie tutaj, aby zrozumieć, kto zadaje które pytania i gdzie. I zabawny cytat, który tu wyrzucę tylko za kopnięcia, jak powiedziałeś: „Jest cienka granica między samoobsługowym BI a samemu F”.
Stan Geiger: Tak.
Eric Kavanagh: Myślałem, że to histeryczne. Ale czy widzisz ten trend samoobsługi, który naprawdę napędza dużą świadomość tego, co robisz z technologią?
Stan Geiger: Tak, ponieważ, jak powiedziałeś, jeśli chcesz zezwolić na samoobsługowe BI, prawdopodobnie będziesz mieć problemy z wydajnością, z powodu tylko: A) ilości dostępu, liczby osób na danych, i B) ilość źle sformułowanych zapytań i sposobów dostępu do nich. Tak więc naprawdę konieczne jest monitorowanie środowiska, aby wszyscy byli zadowoleni z tego, że próbują zużywać dane, prawda?
Eric Kavanagh: Tak, myślę, że dokładnie tak jest. To błogosławieństwo i klątwa: dobrze, że ludzie próbują używać tych rzeczy, ale znowu, jeśli chodzi o ciebie, nie masz odpowiedniego narzędzia w tym czasie, będziesz niezadowolonym obozowiczem, ponieważ rzucasz z samoobsługi bez takiego narzędzia, wydaje mi się, że to tylko góra kłopotów.
Stan Geiger: Tak, mam na myśli, że jest to podobne do tego, kiedy budowałem hurtownie danych, to tak, jakbyś nie miał odpowiednich tabel wymiarów i faktów, a następnie zwolniłeś go do raportowania ad hoc, możesz chcieć się czołgać pod skała.
Eric Kavanagh: To niesamowite. Tak, to dobrze, znowu, to dobra wiadomość, że ludzie używają tych rzeczy, ale myślę, że muszę wierzyć, że samoobsługa będzie prowadzić dużą aktywność do tego, co robisz, ponieważ mówisz o rampie wzrost napięcia i nacisku na te systemy o rzędy wielkości. Nie tylko o jeden lub dwa rzędy wielkości i właśnie w tym momencie naprawdę chcesz mieć widoczność i chcesz wiedzieć, kto robi co, gdzie, kiedy, jak i dlaczego. Zadaj te pytania, a następnie podejmij decyzje, w jaki sposób możesz monitorować i zmieniać środowisko oraz zmieniać zasady dotyczące tego, kto ma dostęp do tego, prawda?
Stan Geiger: Racja. I wiesz także, wiedząc, widząc, że wykorzystanie pozwala ci tam wejść, i potencjał, tak jak wspomniałem o obiekcie w sześcianie, mogę robić rzeczy, aby to poprawić, że o ile buduję i projektuję rzeczy Dlatego konieczne jest, aby nie tylko spojrzeć na wydajność rzeczy, ale także móc zobaczyć, jak działa Twój schemat i projekt na tym poziomie, aby móc wprowadzać poprawki. Będzie coraz większy, ponieważ takie rzeczy jak power BI to teraz wielka sprawa, z Microsoftem, więc teraz mogę budować własne pulpity nawigacyjne, widżety i inne rzeczy, i nie muszę być programistą BI.
Eric Kavanagh: Zgadza się. Tak, to dobre rzeczy, są wszędzie, ale potrzebujesz jakiegoś sposobu zarządzania tym środowiskiem lub zdobędziesz niezadowolonych użytkowników. Prowadzi to do nieszczęśliwego zarządzania, co prowadzi do zwolnienia ludzi. Kiedy rzeczy zaczynają wchodzić w grę, jest całkiem wyraźny efekt domina, ale to świetne rzeczy.
Więc przeżułem tutaj przez ostatnie pięć minut. Robin, masz jakieś pytania?
Robin Bloor: Szczerze mówiąc, myślę, że to fascynujące. To sprawia, że myślę o tym, że mieliśmy bardzo ograniczone środowiska, a samoobsługa faktycznie zmienia świat, a wiele z tych rzeczy dzieje się naprawdę, ponieważ do środowiska przybyło o wiele więcej danych niż wcześniej. Jedyne pytanie, bo nie mamy dużo czasu, ale jedyne pytanie, które chciałbym zadać, to to, że wyjaśniłeś sposób, w jaki - ponieważ myślałem, że to bardzo dobre demo - sposób, w jaki Monitorowanie BI działa. Zastanawiałem się, co właściwie robią ludzie, którzy nie mają tego rodzaju rzeczy? Ponieważ musi to być bardzo trudne, istnieje wiele rzeczy, w których robisz różnicę, podstawowa przyczyna jest dobra, niekoniecznie zawsze dochodzisz do pierwotnej przyczyny, ale możesz dostać się do pierwotnej przyczyny za pomocą niektórych rzeczy na które patrzysz, kiedy powiedziałeś, że wiele osób kupuje to narzędzie tylko po to, by wiedzieć, kto co kieruje, i że mój umysł się kręci, ponieważ to tak, jakbyś nie wiedział, kto co kieruje, a następnie rzeczy wymknęły się spod kontroli. Jak więc wygląda środowisko, gdy wymyka się spod kontroli?
Stan Geiger: Mam na myśli, że możesz sam zdobyć wszystkie te informacje, które mamy w narzędziu, ale musisz napisać kilka własnych skryptów, a ponieważ wszystkie dane są tam, po prostu musisz wiedzieć, gdzie rozumiem, co wymaga pewnego poziomu wiedzy, prawda? Więc w środowiskach, w których nie masz takiego poziomu wiedzy, w zasadzie to, co dostajesz, jest, hej, czy to w górę, czy w dół? Naprawdę nie wiem, czy działa sprawnie, czy nie, ale działa poprawnie, prawda? A potem zaczynam odbierać telefony lub dzwonić: „Hej, mojego raportu nie ma w mojej skrzynce odbiorczej, co się dzieje?” Lub „Właśnie przesłałem ten raport za pośrednictwem usług sprawozdawczych” lub mogą oni tutaj zapytać w usługach analitycznych, ale zajęło to pół godziny i zajęło to tylko 30 sekund, co się dzieje? Cóż, teraz musisz wykonać próbę ognia i spróbować ją rozgryźć, a bez narzędzia stanie się to bardzo trudne.
Robin Bloor: Cóż, właśnie to stało się dla mnie coraz bardziej widoczne, kiedy zademonstrowałeś każdy z wymiarów tego, co naprawdę tu masz. Z drugiej strony, to jest na bardzo, bardzo prymitywnym poziomie, jeśli nie masz alertów, które informują cię, że coś idzie nie tak, to jest po prostu drogie - wpadasz w kosztowną sytuację, próbując wyleczyć to, co się stało, ponieważ nie dowiesz się, dopóki coś nie zacznie się przewracać, prawda?
Stan Geiger: Racja, nie wiesz tego, czego nie wiesz.
Eric Kavanagh: Masz to. Hej, ludzie, spaliliśmy się przez godzinę i przebieramy się tutaj. Bardzo duże dzięki naszemu Robin Bloor i oczywiście naszemu przyjacielowi Stanowi Geigerowi z IDERA Software. Będą na Enterprise Data World, w rzeczywistości, jeśli ktoś z was tam zejdzie, wasz naprawdę będzie tam również w Atlancie. Nasz dobry przyjaciel, Tony Shaw, wykonuje świetną robotę, prowadząc tę konferencję już cztery lata, a hej, co stare, znów jest nowe. Wszystko jest w porządku. Mamy nadzieję, że do zobaczenia, jeśli nie, sprawdź z nami w przyszłym tygodniu, mamy kilka innych audycji internetowych w kolejce.
Zawsze ciekawi twoich myśli, wyślij e-mail, który trafi do mnie, jeśli masz jakieś pytania lub sugestie lub inne technologie, o których chciałbyś się dowiedzieć w Hot Technologies. I dzięki temu pożegnacie się, ludzie. Jeszcze raz dziękujemy za dołączenie do nas, porozmawiamy następnym razem. Dbać. PA pa.
