Przez Techopedia Staff, 19 kwietnia 2017 r
Na wynos: gospodarz Eric Kavanagh omawia prognozowanie z dr Robin Bloor, Rickiem Shermanem i Bulletą Manale z IDERA.
Musisz zarejestrować się na to wydarzenie, aby obejrzeć wideo. Zarejestruj się, aby zobaczyć wideo.
Eric Kavanagh: Panie i panowie, witam jeszcze raz i witamy ponownie w serii webcastów Hot Technologies! Nazywam się Eric Kavanagh, będę gospodarzem dzisiejszego seminarium internetowego, zatytułowanego „Oszczędność czasu, pieniędzy i kłopotów dzięki optymalnym prognozom”. Oczywiście brakowało mi tam pierwszej części tytułu, „Najlepsze rozłożone plany”. zawsze mów o tym w tym programie. Tak więc Hot Technologies jest oczywiście naszym forum do zrozumienia, jakie są niektóre fajne produkty na świecie, świat technologii dla przedsiębiorstw, co ludzie robią z nimi, jak działają, i tego rodzaju zabawne rzeczy.
A dzisiejszy temat, jak sugeruję, dotyczy prognozowania. Naprawdę próbujesz zrozumieć, co się wydarzy w Twojej organizacji. Jak zamierzasz dbać o zadowolenie użytkowników bez względu na to, co robią? Jeśli przeprowadzają analizy, jeśli wykonują prawdziwą pracę, mają do czynienia z prawdziwymi klientami z systemami transakcyjnymi, bez względu na przypadek, chcesz zrozumieć, jak działają twoje systemy i co się dzieje, i to właśnie my ” Opowiem dzisiaj. To trochę zabawne, ponieważ prognozowanie nie jest czymś, co lubię robić, bo jestem przesądny, tak jak myślę, że jeśli przepowiednię za dużo, zdarzają się złe rzeczy, ale to tylko ja. Nie podążaj za mną.
Oto nasi prezenterzy dzisiaj, naprawdę w lewym górnym rogu, Rick Sherman dzwoni z Bostonu, nasz kumpel Bullett Manale z IDERA i nasz własny doktor Robin Bloor. Dzięki temu przekażę to Robinowi i przypomnę ludziom: zadawaj pytania, nie wstydź się, kochamy dobre pytania, przekażemy je dzisiaj naszym prezenterom i innym. I z tym, Robin, zabierz to.
Robin Bloor: OK, cóż, ponieważ jestem na pierwszym miejscu, jak mówią, pomyślałem, że opowiem dziś historię SQL, ponieważ jest to tło dla tego, co odbędzie się dyskusja i nieuchronnie nie będzie się ona kolidować z ponieważ Rick nie koncentruje się na tym i nie będzie sprzeczał się z tym, co ma do powiedzenia. Historia SQL zawiera kilka interesujących rzeczy na temat SQL, ponieważ jest tak dominujący. Zobacz, to literówka, SQL jest językiem deklaratywnym. Pomysł polegał na tym, że możesz stworzyć język, w którym prosisz o to, czego chcesz. Baza danych mogłaby się dowiedzieć, jak ją zdobyć. Właściwie udało się to całkiem dobrze, ale jest wiele rzeczy, które warto o tym powiedzieć, konsekwencje oparcia całej branży IT na deklaratywnym języku. Użytkownik nie zna ani nie dba o fizyczną organizację danych, a to jest dobra zaleta w języku deklaratywnym - oddziela cię od tego wszystkiego, a nawet martwi się o to - po prostu zapytaj o co chcesz, i bazę danych pójdę i wezmę to.
Ale użytkownik nie ma pojęcia, czy sposób, w jaki skonstruuje zapytanie SQL, wpłynie na jego wydajność, co jest nieco wadą. Widziałem zapytania o długości setek i setek wierszy, które są tylko jednym żądaniem SQL, wiesz, zaczyna się od „select” i po prostu kontynuuje od pod-zapytań i tak dalej. I faktycznie okazuje się, że jeśli chcesz konkretnej kolekcji danych z bazy danych, możesz poprosić o nią na wiele różnych sposobów za pomocą SQL i uzyskać tę samą odpowiedź, jeśli masz trochę znajomości danych. Tak więc jedno zapytanie SQL niekoniecznie jest najlepszym sposobem na zapytanie o dane, a bazy danych będą reagować zupełnie inaczej w zależności od wprowadzonego SQL.
I tak, SQL faktycznie wpływa na wydajność, więc ludzie, którzy używają SQL, to prawda, to samo dotyczy programistów SQL, którzy używają SQL, a jeszcze mniej są skłonni myśleć o wpływie, jaki będą mieli, ponieważ większość ich działań skupia się na manipulacji danymi, a nie na uzyskiwaniu, umieszczaniu danych. To samo dotyczy również narzędzi BI, widziałem SQL, który, jeśli chcesz, wyciska się z narzędzi BI różnych baz danych i trzeba powiedzieć, że dużo z tego, no cóż, nie chciałbym t pisać takie zapytania SQL. Ktoś stworzył, jeśli chcesz, mały silnik, który bez względu na parametry, wyrzuci trochę SQL i znowu, ten SQL niekoniecznie będzie wydajnym SQL.
Potem pomyślałem, że wspomnę o niedopasowaniu impedancji, dane, których używają programiści, różnią się od danych podczas sortowania. Tak więc nasz DMS przechowuje dane w tabelach, zorganizowany kod zorientowany obiektowo to w większości kodery, programuje obecnie obiektową formę i porządkuje dane w strukturach obiektowych, więc nie mapuje się między sobą. Konieczne jest więc przetłumaczenie tego, co programista uważa za dane, na to, co baza danych uważa za dane. Wydaje się, że musieliśmy zrobić coś złego, aby tak się stało. SQL ma DDL do definicji danych, ma DML - język manipulacji danymi - wybierz, projektuj i dołącz, aby uzyskać te dane. Teraz jest bardzo mało matematyki i bardzo mało rzeczy opartych na czasie, więc jest to niedoskonały język, chociaż trzeba powiedzieć, że został przedłużony i nadal jest rozszerzany.
I wtedy pojawia się problem z barierą SQL, który jest zawsze prostszy niż schemat, ale wiele osób zadawało pytania z powodów analitycznych, gdy tylko otrzymali odpowiedź na warunki danych pytania, chcą zadać inne pytanie. Staje się więc rzeczą dialogową, no cóż, SQL nie został zbudowany dla okien dialogowych, został zbudowany po to, by pytać o to, czego chcesz od razu. Warto to wiedzieć, ponieważ istnieją pewne produkty, które faktycznie rezygnują z SQL, aby umożliwić konwersację między użytkownikiem a danymi.
Pod względem wydajności bazy danych - i tego rodzaju rozprzestrzenia się na wszystko - tak, jest procesor, jest pamięć, jest dysk, są narzuty sieciowe i jest problem blokowania więcej niż jednej osoby, która chce mieć wyłączne wykorzystanie danych w danym punkt w czasie. Ale są też słabe wywołania SQL, można naprawdę zrobić wiele, jeśli faktycznie zoptymalizujesz SQL pod względem wydajności. Tak więc czynniki wydajności bazy danych: zły projekt, zły projekt programu, brak współbieżności obciążenia, równoważenie obciążenia, struktura zapytań, planowanie wydajności. To jest wzrost danych. W kilku słowach SQL jest wygodny, ale nie sam się optymalizuje.
Powiedziawszy to, myślę, że możemy przekazać Rickowi.
Eric Kavanagh: Dobra, Rick, dam ci klucze do samochodu WebEx. Zabierz to.
Rick Sherman: W porządku, świetnie. Cóż, dzięki Robin, kiedy zaczęliśmy na początku prezentacji, moja grafika jest wciąż dość nudna, ale pójdziemy z tym. Zgadzam się ze wszystkim, o czym mówiła Robin po stronie SQL. Ale teraz chcę się trochę skoncentrować na popycie na dane, przez które przejdziemy bardzo szybko, podaż jak w narzędziach używanych w tej przestrzeni lub potrzeba narzędzi w tej przestrzeni.
Po pierwsze, każdy artykuł, który czytasz, ma związek z dużymi danymi, dużą ilością danych, nieuporządkowanymi danymi pochodzącymi z chmury, dużymi danymi wszędzie, co możesz sobie wyobrazić. Ale wzrost rynku baz danych stale rośnie dzięki SQL, relacyjnej bazie danych prawdopodobnie od 2015 r., Nadal stanowi 95 procent rynku baz danych. Trzej najlepsi dostawcy relacyjni mają około 88 procent udziału w rynku w tej przestrzeni. Wciąż rozmawiamy, tak jak mówił Robin, o SQL. W rzeczywistości, nawet jeśli patrzymy na platformę Hadoop, Hive i Spark SQL - z których mój syn, który jest naukowcem danych, korzysta obecnie cały czas - jest z pewnością dominującym sposobem na dostęp do danych.
Teraz, po stronie bazy danych, istnieją dwie szerokie kategorie wykorzystania baz danych. Jeden dotyczy operacyjnych systemów zarządzania bazami danych, a więc planowania relacji korporacyjnych, zarządzania relacjami z klientami, systemów ERP Salesforce, Oracle, EPIC, N4 itp. Na całym świecie. Ponadto w hurtowniach danych i innych systemach opartych na analizie biznesowej jest duża i stale rosnąca ilość danych. Ponieważ wszystko, niezależnie od tego, gdzie i jak jest przechwytywane, przechowywane lub przeprowadzane, w końcu jest analizowane, a więc istnieje ogromne zapotrzebowanie i wzrost wykorzystania baz danych, szczególnie relacyjnych baz danych na rynku.
Teraz mamy zapotrzebowanie, nadchodzą ogromne ilości danych. I tak naprawdę nie mówię tylko o dużych danych, mówię o wykorzystaniu danych we wszelkiego rodzaju przedsiębiorstwach. Ale towarzysząc temu od strony podaży, dla ludzi, którzy mogą zarządzać tymi zasobami, najpierw zaczynamy, mamy coś w rodzaju niedoboru DBA. Według Bureau of Labor Statistics, w latach 2014–2024 liczba miejsc pracy w DBA wzrośnie tylko o 11% - teraz są to osoby z tytułami DBA, ale o tym porozmawiamy za sekundę - w porównaniu z 40- plus procent rocznej przestrzeni wzrostu danych. I mamy dużo DBA; średnio to samo badanie mówiące o średnim wieku jest dość wysokie w porównaniu do innych zawodów IT. A potem mamy wielu ludzi opuszczających boisko, niekoniecznie przechodzących na emeryturę, ale przechodzących na inne aspekty, zajmujących się zarządzaniem lub cokolwiek innego.
Jednym z powodów, dla których odchodzą, jest to, że zadanie DBA staje się coraz trudniejsze. Po pierwsze, mamy DBA zarządzających wieloma różnymi bazami danych, fizycznymi bazami danych, rozmieszczonymi w każdym miejscu, a także różnymi typami baz danych. Teraz mogą być relacyjne lub mogą to być również inne typy baz danych. Ale nawet jeśli jest to relacyjne, mogą mieć jednego, dwóch, trzech, czterech różnych dostawców, którymi tak naprawdę chcą zarządzać. DBA zazwyczaj angażują się po zaprojektowaniu bazy danych lub aplikacji. Robin mówił o projektowaniu baz danych lub aplikacji oraz o projektowaniu SQL. Cóż, kiedy mówimy o modelowaniu danych, modelowaniu ER, rozszerzonym modelowaniu ER, modelowaniu wymiarów, zaawansowanym modelowaniu wymiarowym, cokolwiek, zwykle programiści aplikacji i deweloperzy aplikacji projektują z myślą o swoim ostatecznym celu - nie projektują pod kątem wydajności sama struktura bazy danych. Mamy więc dużo złego projektu.
Teraz nie mówię o sprzedawcach komercyjnych aplikacji biznesowych; zazwyczaj mają modele ER lub rozszerzone modele ER. Mówię o tym, że w każdej firmie twórcy aplikacji budują o wiele więcej procesów biznesowych i aplikacji - te niekoniecznie są zaprojektowane pod kątem wydajności lub skuteczności wdrażania. A same DBA są przepracowane i czasami ponoszą odpowiedzialność 24/7, ciągle zdobywają coraz więcej baz danych. Myślę, że ma to trochę wspólnego z tym, że ludzie nie do końca rozumieją, co robią i jak to robią. Ich własna mała grupa i ludzie po prostu myślą: „Cóż, wszystkie te narzędzia są tak łatwe w użyciu, że możemy po prostu rzucać coraz więcej baz danych na ich obciążenie”, co nie jest prawdą.
Co prowadzi nas do pracy w niepełnym wymiarze godzin i przypadkowych DBA. Mamy małe zespoły IT i niekoniecznie stać ich na dedykowane DBA. Jest to prawdą w przypadku małych i średnich firm, w których ekspansja bazy danych i aplikacji bazodanowych eksplodowała w ciągu ostatniej dekady i nadal się rozwija. Dotyczy to również dużych korporacji, które od dłuższego czasu zajmują się hurtownią danych, analizami analityki biznesowej. Dawno temu otrzymywaliśmy dedykowane DBA dla tych projektów; nigdy nie otrzymujemy dedykowanego DBA. Jesteśmy odpowiedzialni za zaprojektowanie bazy danych, co jest w porządku, jeśli jest to ktoś, kto ma doświadczenie. Ale ogólnie rzecz biorąc, DBA są programistami aplikacji, często przyjmują tę rolę jako część swojej pracy w niepełnym wymiarze godzin, nie mają formalnego szkolenia w tej dziedzinie i ponownie, projektują ją dla swoich celów końcowych, są nie projektując go pod kątem wydajności.
Istnieje duża różnica między projektowaniem a programowaniem, w porównaniu do wdrażania i zarządzania. Mamy więc „mądrego grosza, głupiego funta” z małą skarbonką, która pomija zdobywanie umiejętności i zasobów potrzebnych w projektach. Myśląc, że wszyscy pochodzą z „Zemsty frajerów”, mój mały obrazek tam. Teraz, o ile ludzie tego potrzebują, mamy coraz większe wykorzystanie baz danych i danych w SQL. Mamy ograniczoną liczbę DBA - ludzi, którzy są wykwalifikowani i ekspertami w tych sytuacjach dostrajania i projektowania oraz zarządzania i wdrażania. Coraz częściej mamy do czynienia z przypadkowymi lub przypadkowymi DBA, ludźmi, którzy nie przeszli formalnego szkolenia.
A więc, jakie są inne rzeczy, które również dotyczą tego, że te bazy danych nie są dostrajane ani zarządzane? Po pierwsze, wiele osób zakłada, że sam system bazy danych ma wystarczające narzędzia do samodzielnego zarządzania. Teraz narzędzia stają się coraz łatwiejsze - projektowanie i rozwój - ale to coś innego niż robienie dobrego projektu i dobrego zarządzania, planowania wydajności, monitorowania itp. W celu wdrożenia. Po pierwsze, ludzie zakładają, że mają wszystkie potrzebne narzędzia. Po drugie, jeśli jesteś niepełnoetatowym lub przypadkowym DBA, nie wiesz, czego nie wiesz.
Wydaje mi się, że zapomniałem o niektórych frazach, więc często nie rozumieją, na co muszą patrzeć w projekcie lub kiedy zarządzają bazami danych lub nimi zarządzają. Jeśli to nie jest twój zawód, nie zrozumiesz, co musisz zrobić. Po trzecie, SQL jest narzędziem typu „go-to”, więc Robin mówił o SQL i o tym, jak słabo skonstruowany jest SQL. A także jednym z moich domowych pomysłów w zakresie hurtowni danych BI, migracji danych, przestrzeni inżynierii danych jest to, że zamiast narzędzi, ludzie mają tendencję do pisania kodu SQL, procedur przechowywanych, nawet jeśli używają drogiego narzędzia do integracji danych lub drogie narzędzie BI, często naprawdę używają go tylko do uruchamiania procedur przechowywanych. Dlatego coraz ważniejsze staje się zrozumienie projektowania baz danych, konstrukcji SQL.
I wreszcie jest to podejście silosowe, w którym indywidualni ludzie patrzą na poszczególne bazy danych. Nie patrzą na to, jak aplikacje działają i współdziałają ze sobą. I tak naprawdę często patrzą na bazy danych w porównaniu do aplikacji, w których ich używają. Tak więc obciążenie pracą bazy danych jest krytyczne przy projektowaniu, krytyczne przy jego dostrajaniu, krytyczne przy próbach wymyślenia, jak zaplanować pojemność itp. Tak więc patrząc na las z drzew, ludzie są w chwastach, patrząc na poszczególne tabele i bazy danych i nie patrząc na ogólną interakcję tych aplikacji w obciążeniu.
Wreszcie ludzie muszą spojrzeć na kluczowe obszary, na które powinni spojrzeć. Kiedy planują zarządzać bazami danych, muszą najpierw pomyśleć o, opracować pewne wskaźniki wydajności skoncentrowane na aplikacjach, więc muszą przyjrzeć się nie tylko strukturze tabeli, jej szczególnemu modelowaniu, ale w jaki sposób jest ona wykorzystywana? Tak więc, jeśli masz aplikację korporacyjną wymaganą do zarządzania łańcuchem dostaw, jeśli odbierasz zamówienia z Internetu, jeśli wykonujesz BI - cokolwiek robisz - musisz sprawdzić, kto z nich korzysta, w jaki sposób używając go, jakie są objętości danych, kiedy to się stanie. To, czego tak naprawdę szukasz, to czasy oczekiwania, ponieważ bez względu na wszystko, wszystkie aplikacje są oceniane na podstawie tego, ile czasu zajmuje wykonanie zadania, niezależnie od tego, czy jest to osoba, czy tylko wymiana danych między aplikacjami lub procesorami. A jakie są wąskie gardła? Tak często, gdy próbujesz debugować problemy, naprawdę próbujesz spojrzeć na prawdziwe wąskie gardła - niekoniecznie jak dostroić wszystko, ale jak się pozbyć i zwiększyć wydajność i przepustowość - wszystko, na co musisz spojrzeć.
Naprawdę musisz oddzielić przechwytywanie danych, transakcje, aspekty transformacji w bazie danych wraz z analizami. Każdy z nich ma inne wzorce projektowe, każdy z nich ma inne wzorce użytkowania i każdy z nich musi być dostrojony inaczej. Musisz więc pomyśleć o tym, jak te dane są wykorzystywane, kiedy są wykorzystywane, do czego są wykorzystywane, i dowiedzieć się, jakie wskaźniki wydajności i jakie są kluczowe rzeczy, które chcesz analizować związane z tym użyciem. Teraz, gdy patrzysz na monitorowanie wydajności, chcesz przyjrzeć się samym operacjom bazy danych; chcesz przyjrzeć się obu strukturom danych, więc indeksy, partycjonowanie i inne fizyczne aspekty bazy danych, a nawet strukturę bazy danych - czy to model ER, czy model wymiarowy, jednak bez względu na strukturę - wszystkie te rzeczy mają wpływ na wydajność, szczególnie w różnych kontekstach analizy przechwytywania danych i zachodzących transformacjach.
I jak wspomniano Robin po stronie SQL, sprawdzenie SQL, który jest uruchamiany przez te różne aplikacje w tych bazach danych, i dostrojenie go ma kluczowe znaczenie. I patrząc na ogólne obciążenia aplikacji oraz środowisko infrastruktury, w którym działają te bazy danych i aplikacje. Tak więc, że sieci, serwery, chmura - niezależnie od tego, na czym działają - również patrząc na wpływ, jaki te aplikacje i te bazy danych wywierają w tym kontekście, wszystkie one mogą współdziałać z możliwością dostrojenia bazy danych.
I wreszcie, gdy patrzysz na narzędzia, chcesz mieć możliwość spojrzenia na trzy różne rodzaje analiz z tym związanych. Chcesz spojrzeć na analizę opisową: co się dzieje i gdzie, związane z bazą danych i wydajnością aplikacji. Chcesz mieć możliwość przeprowadzania analiz diagnostycznych, aby dowiedzieć się nie tylko, co się dzieje, ale dlaczego tak się dzieje, gdzie są wąskie gardła, gdzie są problemy, co działa dobrze, a co nie działa dobrze? Ale możliwość analizowania i drążenia w obszarach problemowych w celu rozwiązania tych problemów, zarówno w zakresie projektowania, jak i tego, co musisz zrobić.
Wreszcie najbardziej agresywnym lub proaktywnym typem analizy jest przeprowadzenie analizy predykcyjnej, modelowanie analizy predykcyjnej, cokolwiek. Wiemy, że baza danych i aplikacje działają w tym kontekście, jeśli zwiększymy pojemność, jeśli zdobędziemy więcej użytkowników, jeśli zwiększymy przepustowość, cokolwiek robimy, będziemy w stanie przewidzieć, co, jak i gdzie to zrobi wpływ na bazę danych, aplikacje, pozwala nam planować i aktywnie się zastanawiać, gdzie są wąskie gardła, gdzie mogą cierpieć czasy oczekiwania i co musimy zrobić, aby to naprawić. Dlatego chcemy mieć narzędzia, które są w stanie zaimplementować wskaźniki wydajności, monitorować wydajność, podobnie jak te trzy rodzaje analiz. I to jest mój przegląd.
Eric Kavanagh: Dobra, pozwólcie, że to przekażę - nawiasem mówiąc, są to dwie świetne prezentacje - pozwólcie, że przekażę to Bullett Manale, aby zabrała to stamtąd. I ludzie, nie zapomnijcie zadawać dobrych pytań; mamy już dobre treści. Zabierz to, Bullett.
Bullett Manale: Brzmi dobrze. Dzięki, Eric. Tak więc wiele z tego, co powiedział Rick i Robin, oczywiście zgadzam się ze 100 procentami. Powiedziałbym, że podciągnąłem ten slajd, bo myślę, że to pasuje, nie wiem dla tych z was, którzy byli fanami „Drużyny A” w latach 80., John Hannibal Smith miał powiedzenie, że zawsze powiedz: „Uwielbiam to, gdy plan się łączy”, i myślę, że kiedy mówisz o SQL Serveru, na którym skupiamy się, o produkcie, o którym dzisiaj będziemy mówić, Menedżer diagnostyczny SQL, to zdecydowanie jedna z tych rzeczy, które musisz mieć; musisz być w stanie wykorzystać posiadane dane i podejmować decyzje na podstawie tych danych, aw niektórych przypadkach nie szukasz decyzji; szukasz czegoś, co powie Ci, kiedy coś się skończy zasoby, kiedy zabraknie zasobów, kiedy będziesz miał wąskie gardło, tego typu rzeczy.
Nie chodzi tylko o monitorowanie konkretnej metryki. Dzięki Menedżerowi diagnostyki jedną z rzeczy, które robi bardzo dobrze, jest pomoc w zakresie prognozowania i zrozumienia specyficznych obciążeń, a dzisiaj dużo o tym porozmawiamy. Narzędzie jest dostosowane do menedżera danych, DBA lub działającego DBA, więc wiele rzeczy, o których wspomniał Rick, działające DBA jest tak prawdziwe. W wielu przypadkach, jeśli nie jesteś DBA, pojawi się wiele znaków zapytania, jeśli chodzi o zarządzanie środowiskiem SQL, czego nie znasz. Więc szukasz czegoś, co mogłoby ci pomóc, przeprowadzić cię przez ten proces, a także uczyć cię w tym procesie. Dlatego ważne jest, aby narzędzie, którego używasz do tego rodzaju decyzji, dało ci wgląd w powody, dla których podejmowane są te decyzje, nie tylko mówi: „Hej, zrób to”.
Ponieważ jestem aktorką DBA, ostatecznie mogę stać się pełnoprawnym DBA z faktyczną wiedzą fachową i wiedzą na poparcie tego tytułu. To powiedziawszy, kiedy mówimy o byciu administratorem bazy danych - zawsze najpierw pokazuję ten slajd, ponieważ DBA ma kilka różnych ról i zależnie od organizacji, w której jesteś, będziesz mieć, będą się one różnić w zależności od miejsca - ale zazwyczaj zawsze będziesz w jakiś sposób odpowiedzialny za swoje miejsce do przechowywania, planowanie tego miejsca i zrozumienie przewidywania, powinienem powiedzieć, ile miejsca zajmiesz potrzebne, czy to dla twoich kopii zapasowych, czy też dla samych baz danych. Musisz to zrozumieć i ocenić.
Ponadto będziesz musiał być w stanie zrozumieć i zoptymalizować rzeczy zgodnie z potrzebami, a podczas monitorowania środowiska ważne jest, aby wprowadzać zmiany, ponieważ są one potrzebne w oparciu o rzeczy, które zmiana w samym środowisku. Podczas prognozowania należy wziąć pod uwagę liczbę użytkowników, popularność aplikacji, sezonowość bazy danych. A potem, oczywiście, patrząc na inne rzeczy pod względem możliwości dostarczania raportów i informacji, które są niezbędne, ponieważ odnoszą się do podejmowania tych decyzji. W wielu przypadkach oznacza to przeprowadzenie analizy porównawczej; oznacza to zdolność spojrzenia na konkretną metrykę i zrozumienia jej wartości w czasie, aby można było przewidzieć, w którym kierunku będzie się rozwijać.
Tak więc wiele narzędzi, które robi Menedżer diagnostyczny, ma te możliwości i ludzie używają go na co dzień, aby móc robić takie rzeczy, jak prognozowanie, i tutaj umieściłem definicję planowania wydajności. I jest to dość szeroka i właściwie niejasna definicja, która jest po prostu procesem określania zdolności produkcyjnej potrzebnej organizacji, aby sprostać zmieniającym się wymaganiom dotyczącym jej produktów, a na koniec o to właśnie chodzi: o tym, że możesz zbierać informacje, które masz w ten czy inny sposób, a także podejmować te informacje i podejmować decyzje, które pomogą ci iść naprzód w miarę postępów w cyklu życia baz danych. A zatem rodzaje rzeczy, które są powodem, dla których ludzie muszą to robić, to przede wszystkim, w większości przypadków, oszczędność pieniędzy. Oczywiście, ich głównym celem jest zarabianie pieniędzy i oszczędzanie pieniędzy. Ale wraz z tym oznacza to również możliwość upewnienia się, że przestoje nie występują. I będąc w stanie upewnić się, że zmniejszysz wszelkie szanse na przestój, więc powstrzymaj go od rozpoczęcia, innymi słowy, nie czekaj na to, a następnie zareaguj.
Oprócz możliwości ogólnego zwiększenia wydajności użytkowników, zwiększenie ich wydajności i zwiększenie wydajności biznesowej jest oczywiście kluczem tutaj, więc są to rodzaje rzeczy, które jako DBA lub ktoś zaangażowany w prognozowanie lub wydajność planowanie będzie musiało przebrnąć przez informacje, aby móc podejmować te decyzje. A potem, ogólnie rzecz biorąc, to oczywiście pomoże ci wyeliminować marnotrawstwo, nie tylko pod względem pieniędzy, ale także pod względem czasu i ogólnie po prostu zasobów, które mogłyby zostać wykorzystane na inne rzeczy. Tak więc, będąc w stanie wyeliminować te odpady, abyś nie miał kosztów alternatywnych związanych z samymi odpadami.
Tak więc, powiedziawszy, jakie są rodzaje pytań, które otrzymujemy, specyficzne dla osoby, która jest DBA? Kiedy zabraknie mi miejsca? To duże, nie tylko ile zajmuję teraz, ale kiedy mam się skończyć, opierając się na trendach i historii z przeszłości? To samo z rzeczywistymi instancjami SQL, bazami danych, które serwery mogę konsolidować? Zamierzam umieścić trochę na maszynach wirtualnych, co ma sens pod względem tego, które bazy danych będę konsolidować i które wystąpienia SQL powinny się znajdować? Należy odpowiedzieć na wszystkie tego rodzaju pytania. Ponieważ w większości przypadków, jeśli jesteś DBA lub działasz DBA, skonsolidujesz go w swojej karierze. W wielu przypadkach będziesz robił to na bieżąco. Musisz więc szybko podejmować te decyzje, a nie grać w zgadywanie.
Rozmawialiśmy o wąskich gardłach i miejscu, w którym będą się one pojawiać, będąc w stanie przewidzieć to jeszcze raz, zamiast czekać na ich wystąpienie. Oczywiście wszystkie te rzeczy, o których mówimy, mają sens w tym sensie, że polegają na danych historycznych, w większości przypadków, aby móc wygenerować te rekomendacje lub w niektórych przypadkach samodzielnie podejmować decyzje, aby móc wymyślić te odpowiedzi. Ale przypomina mi o tym, że kiedy słyszysz reklamy radiowe dla kogoś, kto sprzedaje papiery wartościowe lub coś w tym rodzaju, zawsze „wyniki z przeszłości nie wskazują na przyszłe wyniki” i tego rodzaju rzeczy. I to samo dotyczy tutaj. Będziesz mieć sytuacje, w których te prognozy i analizy mogą nie być w 100% prawidłowe. Ale jeśli masz do czynienia z rzeczami, które wydarzyły się w przeszłości i ze znanymi, i że możesz wziąć i zrobić „a co jeśli” z wieloma tego typu pytaniami, na które wpadniesz, jest bardzo cenna i da ci to znacznie więcej niż granie w zgadywanie.
Więc tego rodzaju pytania oczywiście pojawią się, więc jak radzimy sobie z wieloma z tych pytań za pomocą Diagnostic Managera, przede wszystkim mamy możliwości prognozowania, będąc w stanie to zrobić w bazie danych, również przy stole jako dysk lub wolumin. Aby móc nie tylko powiedzieć: „Hej, mamy dużo miejsca”, ale za sześć miesięcy, za dwa lata, za pięć lat, jeśli planuję na to, ile miejsca na dysku na budżet? To są pytania, które muszę zadać i będę musiał umieć to zrobić, zamiast zgadywać i podnosić palec w powietrze i czekać, aby zobaczyć, w którą stronę wieje wiatr, co jest często niestety sposobem, w jaki podejmowanych jest wiele takich decyzji.
Poza tym, będąc w stanie - wygląda na to, że mój slajd został tam trochę odcięty - ale będąc w stanie zapewnić pomoc w formie zaleceń. Jedną rzeczą jest pokazanie pulpitu pełnego wskaźników i powiedzenie: „OK, tutaj są wszystkie dane i gdzie się znajdują”, ale potem jest możliwość zrobienia niektórych lub zrozumienia co robić, na tej podstawie to kolejny skok. W niektórych przypadkach ludzie są wystarczająco wykształceni w roli DBA, aby móc podejmować takie decyzje. Mamy więc w narzędziu kilka mechanizmów, które pomogą w tym, co pokażemy za chwilę. Ale będąc w stanie pokazać nie tylko, co to jest rekomendacja, ale także dać wgląd w to, dlaczego ta rekomendacja jest tworzona, a ponadto, w niektórych przypadkach, być w stanie wymyślić skrypt, który automatyzuje rozwiązanie tego problemu jest również idealne.
Przechodząc do następnego tutaj, co zobaczymy, po prostu ogólnie rozumiem do poziomu metrycznego, co jest normalne. Nie mogę ci powiedzieć, co nie jest normalne, jeśli nie wiem, co jest normalne. I tak, mając pewien sposób na zmierzenie tego, co jest kluczowe, musisz być w stanie wziąć pod uwagę wiele rodzajów obszarów, na przykład - lub powinienem powiedzieć, ramy czasowe - różne grupy serwerów, będąc w stanie to zrobić dynamicznie, z alarmującego punktu widzenia, innymi słowy, w środku nocy, podczas mojego okna konserwacji, oczekuję, że mój procesor będzie działał na poziomie 80 procent w oparciu o wszystkie trwające czynności konserwacyjne. Mogę więc chcieć podnieść progi wyżej, w tych przedziałach czasowych, a może w środku dnia, kiedy nie mam tak dużej aktywności.
Są to pewne rzeczy, które oczywiście będą środowiskowe, ale rzeczy, które możesz zastosować do tego, co jest zarządzane, aby pomóc ci efektywniej zarządzać tym środowiskiem i ułatwić to. Innym obszarem jest oczywiście ogólne dostarczanie raportów i informacji, aby móc odpowiedzieć na tego rodzaju pytania „co, jeśli”. Jeśli właśnie dokonałem zmiany w moim środowisku, chcę zrozumieć, jaki był ten wpływ, aby móc zastosować tę samą zmianę w innych instancjach lub innych bazach danych w moim środowisku. Chcę mieć trochę informacji lub amunicji, aby dokonać tej zmiany z pewnym spokojem i wiedząc, że to będzie dobra zmiana. Tak więc, będąc w stanie sporządzać raporty porównawcze, móc klasyfikować moje instancje SQL, móc porównywać moje bazy danych względem siebie, mówiąc: „Który jest moim największym konsumentem procesora?” Lub który z nich zajmuje najwięcej czasu warunki oczekiwania i tym podobne? Wiele z tych informacji będzie dostępnych również w narzędziu.
I wreszcie, jest to po prostu ogólna umiejętność, że potrzebujesz narzędzia, które będzie w stanie poradzić sobie w każdej sytuacji, która przyjdzie ci na drodze, a więc mam na myśli to, że masz duże środowisko z w wielu przypadkach prawdopodobnie natkniesz się na sytuacje, w których musisz wyciągnąć metryki, które tradycyjnie nie są metrykami, które DBA chciałby nawet monitorować w niektórych przypadkach, w zależności od konkretnej sytuacji. Tak więc posiadanie narzędzia, które można rozszerzać, aby móc dodawać dodatkowe metryki i móc korzystać z tych metryk w tej samej formie i stylu, w jakim byś ich używał, gdybyś używał gotowego produktu na przykład metryka. Tak więc możliwość generowania raportów, alarmowania i bazowania - wszystkie rzeczy, o których mówimy - jest również kluczową częścią możliwości przeprowadzenia tego prognozowania i uczynienia go tak, aby uzyskać odpowiedzi, których szukasz móc podejmować te decyzje i iść naprzód.
Teraz, w sposób, w jaki robi to Menedżer diagnostyczny, mamy scentralizowaną usługę, grupę usług, która działa, zbiera dane dla instancji od 2000 do 2016. A potem robimy, że bierzemy te dane i umieszczamy je w centralnym repozytorium, a następnie, co zrobimy z tymi danymi, oczywiście, robimy wiele, aby zapewnić dalszy wgląd. Teraz oprócz tego - i jednej z rzeczy, których tu nie ma - jest także usługa, która działa w środku nocy, która jest naszą usługą analizy predykcyjnej i która powoduje pewne załamanie liczb i pomaga zrozumieć i pomagać jako DBA lub działający DBA, aby móc formułować tego rodzaju rekomendacje, a także zapewniać wgląd w podstawowe wartości.
Tak więc, co chciałbym zrobić, a to tylko szybki przykład architektury, wielkim na wynos jest to, że nie ma żadnych agentów ani usług, którzy faktycznie siedzą w instancjach, którymi zarządzasz. Ale chciałbym tylko zabrać cię do aplikacji tutaj i dać ci szybką wersję demonstracyjną. I pozwól mi też wyjść i sprawić, by tak się stało. Więc daj mi znać, myślę, że Eric, widzisz to w porządku?
Eric Kavanagh: Mam go teraz, tak.
Bullett Manale: OK, więc przeprowadzę cię przez niektóre z tych części, o których mówiłem. Zasadniczo zacznijmy od rzeczy, które są bardziej zgodne z tym, co musisz zrobić, lub tutaj jest coś, co będzie momentem w przyszłości, a my damy ci wgląd w to. I jest to w stanie naprawdę przewidywać - lub powinienem powiedzieć dynamicznie przewidywać - rzeczy, które się dzieją. Teraz, w przypadku raportów, jedną z rzeczy, które mamy w narzędziu, są trzy różne raporty prognozowania. I w przypadku, na przykład, prognozy bazy danych, co prawdopodobnie zrobiłbym w sytuacji, gdybym był w stanie przewidzieć rozmiar bazy danych w pewnym okresie czasu, a ja podam tylko kilka przykładów tego . Więc wezmę moją bazę danych audytu, która jest dość intensywna we / wy - ma do niej dużo danych. Zobaczmy, zrobimy to tutaj i po prostu wybierzmy bazę danych opieki zdrowotnej tutaj.
Ale chodzi o to, że nie tylko widzę, jaka jest na tym przestrzeń, ale mogę powiedzieć: „Spójrzmy, weźmy dane z ubiegłego roku” - i zamierzam tu trochę sfałszować, Naprawdę nie mam danych z roku, mam dane z około dwóch miesięcy - ale ponieważ wybieram tutaj częstotliwość próbkowania miesięcy, będę mógł przewidzieć lub przewidzieć w tym w przypadku kolejnych 36 jednostek, ponieważ nasza częstotliwość próbkowania jest ustawiona na miesiące - to jest na jednostkę, jest miesiąc - i wtedy byłbym w stanie, a następnie uruchomić raport, aby w zasadzie pokazać mi, gdzie spodziewamy się naszego przyszłego wzrostu, dla tych trzy bazy danych. I widzimy, że mamy różny stopień różnicy lub wariancji między trzema różnymi bazami danych, szczególnie w odniesieniu do ilości danych, które zużywają historycznie.
Widzimy, że punkty danych reprezentują dane historyczne, a następnie linia dostarczy nam prognozę, wraz z liczbami na poparcie tego. Więc możemy to zrobić na poziomie stołu, możemy to zrobić nawet na poziomie dysku, gdzie mogę przewidzieć, jak duże będą moje dyski, w tym punkty montowania. Bylibyśmy w stanie przewidzieć ten sam rodzaj informacji, ale ponownie, w zależności od częstotliwości próbkowania, pozwolę mi określić, ile jednostek i gdzie bierzemy to, co chcemy prognozować. Zauważ też, że mamy różne typy typów prognoz. Masz więc wiele opcji i elastyczność, jeśli chodzi o czas na prognozowanie. Teraz to jedna z rzeczy, które zrobimy, podając konkretną datę i mówiąc „Hej, w tym dniu spodziewalibyśmy się wzrostu twoich danych”. Oprócz tego możemy zapewniamy inne informacje związane z niektórymi analizami, które przeprowadzamy w czasie wolnym od pracy, oraz z usługą, gdy jest ona uruchomiona. Jedną z rzeczy, które robi, jest próba przewidywania rzeczy, które prawdopodobnie się wydarzą, na podstawie historii, kiedy coś się wydarzyło w przeszłości.
Możemy więc zobaczyć tutaj, w rzeczywistości, prognoza dostarcza nam wglądu w prawdopodobieństwo, że będziemy mieć problemy przez cały wieczór w oparciu o rzeczy, które powtórzyły się w przeszłości. Oczywiście jest to świetne, zwłaszcza jeśli nie jestem DBA, mogę na te rzeczy patrzeć, ale jeszcze lepiej, jeśli nie jestem DBA, to ta karta analizy. Tak więc, zanim pojawiło się to w narzędziu, przejrzeliśmy produkt i pokazaliśmy go ludziom: „To świetnie, widzę te wszystkie liczby, widzę wszystko, ale nie wiem, co robić” (śmiech) „W wyniku tego”. A więc to, co tu mamy, jest lepszym sposobem na zrozumienie, jeśli zamierzam podjąć działania w celu poprawy wydajności, jeśli zamierzam podjąć działania nawet pomagam w utrzymaniu zdrowia mojego środowiska, będąc w stanie zapewnić rankingowy sposób dostarczania tych rekomendacji, a także przydatne wskazówki w informacji, aby dowiedzieć się więcej o tych rekomendacjach i faktycznie mając nawet zewnętrzne linki do niektórych z tych danych, które pokażą mi i zabierz mnie do powodów, dla których sformułowano te zalecenia.
W wielu przypadkach jest w stanie dostarczyć skrypt, który zautomatyzuje, jak powiedziałem, rozwiązanie tych problemów. Teraz część tego, co robimy tutaj z tą analizą - i pokażę ci, kiedy wejdę, aby skonfigurować właściwości tego wystąpienia i przejdę do sekcji konfiguracji analizy - mamy wiele różnych kategorii, które są wymienione tutaj, a po części mamy optymalizację indeksu i optymalizację zapytań. Oceniamy więc nie tylko same metryki i tego typu rzeczy, ale także takie rzeczy, jak obciążenia i indeksy. W tym przypadku przeprowadzimy dodatkową analizę indeksu hipotetycznego. Jest to więc jedna z tych sytuacji, w których nie chcę, w wielu przypadkach nie chcę dodawać indeksu, jeśli nie muszę. Ale w pewnym momencie pojawia się punkt zwrotny, w którym mówię: „Cóż, tabela osiąga rozmiar lub rodzaje zapytań, które są uruchamiane w ramach obciążenia, mają teraz sens, aby dodać indeks. Ale to nie miałoby sensu może sześć tygodni wcześniej. ”To pozwala ci dynamicznie uzyskać wgląd w rzeczy, które prawdopodobnie, jak powiedziałem, poprawią wydajność w oparciu o to, co dzieje się w środowisku, co dzieje się w ramach obciążeń roboczych i robienie tego rodzaju rzeczy.
Otrzymujesz tutaj wiele dobrych informacji, a także możliwość automatycznej optymalizacji tych rzeczy. Jest to więc kolejny obszar, w którym moglibyśmy pomóc, jeśli chodzi o tak zwaną analizę predykcyjną. Poza tym, powinienem powiedzieć, że mamy także inne obszary, które moim zdaniem po prostu nadają się do pomocy w podejmowaniu decyzji. A kiedy mówimy o podejmowaniu decyzji, po raz kolejny, mogąc spojrzeć na dane historyczne, daj nam wgląd w to, gdzie powinniśmy być, aby poprawić tę wydajność.
Teraz jedną z rzeczy, które możemy zrobić, jest bazowy wizualizator, który pozwala nam selektywnie wybierać dowolne parametry, które chcielibyśmy - i pozwól mi znaleźć tutaj porządną - przechodzę do użycia procesora SQL, ale chodzi o ciebie może cofnąć się o wiele tygodni, aby namalować te zdjęcia, aby zobaczyć, kiedy są wartości odstające, i ogólnie powiedzieć, gdzie ta wartość spada w okresach, w których zbieramy dane. Poza tym zauważysz również, że kiedy przejdziemy do samej instancji, mamy możliwość skonfigurowania naszych linii bazowych. A linie bazowe są naprawdę ważną częścią możliwości automatyzacji rzeczy, a także możliwości powiadamiania o nich. A wyzwaniem, jak powiedziałaby większość DBA, jest to, że twoje środowisko nie zawsze działa tak samo, w ciągu dnia, w porównaniu do wieczora i co tam więcej, jak wspominaliśmy wcześniej w przykładzie z okresami konserwacji, kiedy mają wysoki poziom procesora lub cokolwiek, co może się dziać.
Tak więc w tym przypadku, z tymi rzeczywistymi wartościami podstawowymi, możemy mieć wiele poziomów bazowych, więc mogę mieć na przykład poziom bazowy, to znaczy w godzinach pracy. Ale równie łatwo mogę stworzyć punkt odniesienia dla moich godzin produkcji. Chodzi o to, że kiedy wchodzimy w instancję SQL i faktycznie mamy te wiele linii bazowych, wtedy będziemy w stanie przewidzieć i być w stanie wykonać pewien rodzaj automatyzacji, pewnego rodzaju naprawy lub po prostu alarmować w ogóle, inaczej specyficzne dla tych okien czasu. Tak więc jedną z rzeczy, które tu zobaczysz, jest to, że generowane przez nas linie bazowe wykorzystują dane historyczne do dostarczenia tej analizy, ale co ważniejsze, mogę zmienić te progi statycznie, ale mogę również zautomatyzować je dynamicznie. Tak więc, gdy pojawia się okno konserwacji, lub powinienem powiedzieć, że okno linii bazowej konserwacji się pojawia, progi te automatycznie przełączają się w zależności od obciążeń, które napotykam w tym oknie czasu, a może w środku dnia, kiedy moje obciążenia są nie tak bardzo, gdy obciążenia nie mają tak dużego wpływu.
Jest to więc coś, o czym należy pamiętać, jeśli chodzi o poziom podstawowy. Oczywiście będą one dla ciebie naprawdę pomocne, jeśli chodzi o zrozumienie tego, co jest normalne i możliwość zrozumienia, angażuj się, gdy zabraknie Ci zasobów. Innym rodzajem rzeczy, które mamy w narzędziu, które pomogą ci podejmować decyzje, a także bazowanie i możliwość ustawiania alertów wokół tych linii bazowych i progów, które tworzysz dynamicznie, jest jak powiedziałem wcześniej: po prostu mogę uruchomić całą masę raportów, które pomogą mi odpowiedzieć na pytania o to, co się dzieje.
Przykładowo, gdybym miał 150 instancji, którymi zarządzam - w moim przypadku nie, więc musimy tu zagrać w udawaną grę - ale gdybym miał wszystkie moje instancje produkcyjne i musiałem zrozumieć, gdzie jest obszar, na który muszę zwrócić uwagę, innymi słowy, jeśli będę miał ograniczony czas na wykonanie jakiegoś rodzaju administracji w celu poprawy wydajności, chcę skupić się na kluczowych obszarach. Powiedziawszy to, mógłbym powiedzieć: „W oparciu o to środowisko, uszereguj moje instancje względem siebie i daj mi ten ranking według potyczki”. Więc czy jest to użycie dysku, użycie pamięci, czy czeka, bez względu na to, czy chodzi o czas reakcji, jestem w stanie skorelować - lub powinienem powiedzieć rangę - te przypadki ze sobą. Oczywiście instancja, która znajduje się na górze każdej listy, jeśli jest to ta sama instancja, to prawdopodobnie coś, na czym naprawdę chcę się skupić, ponieważ oczywiście jest to znowu na górze listy.
W narzędziu masz więc wiele raportów, które pomogą ci w rankingu środowiska na poziomie instancji; możesz to zrobić również na poziomie bazy danych, gdzie mogę porównać swoje bazy danych. W szczególności dla progów i obszarów, które mogę ustawić, mogę nawet ustawić tutaj symbole wieloznaczne, jeśli chcę, aby skupić się tylko na określonych bazach danych, ale chodzi o to, że mogę porównywać moje bazy danych w ten sam sposób. Ponadto, o ile inne rodzaje analizy porównawczej i duża w tym narzędziu, są analizą bazową, którą mamy. Jeśli przewiniesz w dół do widoku usługi tutaj, zobaczysz, że istnieje podstawowy raport statystyczny. Teraz ten raport oczywiście pomoże nam zrozumieć nie tylko, jakie są wartości metryk, ale w konkretnym przypadku mógłbym wyjść, a dla każdej z tych metryk być w stanie faktycznie spojrzeć na linie bazowe tych metryk.
Cokolwiek by to nie było, jako procent lub cokolwiek, co mógłbym wyjść i powiedzieć: „Zobaczmy linię bazową tego podziału w ciągu ostatnich 30 dni”, w którym to przypadku pokaże mi rzeczywiste wartości w porównaniu z linią bazową i Byłbym w stanie podjąć pewne decyzje na podstawie tych informacji, oczywiście, więc jest to jedna z tych sytuacji, w których będzie to zależeć od pytania, które zadajesz w tym czasie. Ale to oczywiście pomoże ci w przypadku wielu tych pytań. Chciałbym powiedzieć, że mamy jeden raport, który to wszystko robi, i jest to coś w rodzaju łatwego raportu, w którym naciskasz i naciskasz, a on po prostu odpowiada na każde pytanie „co, jeśli”, na które kiedykolwiek możesz odpowiedzieć. Ale w rzeczywistości będziesz mieć wiele atrybutów i wiele opcji do wyboru w tych rozwijanych menu, aby móc sformułować te pytania typu „co, jeśli”, których szukasz .
Dlatego wiele z tych raportów ma na celu udzielenie odpowiedzi na tego rodzaju pytania. Dlatego tak ważne jest, aby te raporty, a ponadto wszystkie rzeczy, które już pokazaliśmy w narzędziu, jak już wspomniałem, mają elastyczność w zakresie wprowadzania nowych wskaźników, którymi można zarządzać, a nawet mogą tworzyć liczniki lub zapytania SQL, które są uwzględnione w interwałach odpytywania, aby pomóc mi odpowiedzieć na te pytania, które być może po wyjęciu z pudełka, których nie spodziewaliśmy się monitorować, możesz dodać te rzeczy. I wtedy będziesz w stanie robić te same rzeczy, które ci pokazałem: bazować, uruchamiać raporty i tworzyć raporty na podstawie tych danych, a także być w stanie odpowiadać i wykonywać wiele różnych rodzajów rzeczy, które ci pokazuję tutaj.
Teraz, oprócz tego - i jedną z rzeczy, na które ostatnio ostatnio wpadamy dość często, jest - po pierwsze, wszyscy przerzucali lub przestawiali się na maszyny wirtualne. A teraz mamy wielu ludzi, którzy udają się do chmury. I pojawia się wiele pytań dotyczących tego rodzaju rzeczy. Czy sensowne jest dla mnie przejście do chmury? Czy zamierzam zaoszczędzić pieniądze, przenosząc się do chmury? Gdybym miał umieścić te rzeczy na maszynie wirtualnej na maszynie z zasobami współdzielonymi, ile pieniędzy mogę zaoszczędzić? Tego rodzaju pytania, oczywiście, również się pojawią. Mając to na uwadze, należy pamiętać o tym, że dzięki Diagnostic Manager możemy dodawać i pobierać ze zwirtualizowanych środowisk VMware i Hyper-V. Możemy również dodawać instancje znajdujące się w chmurze, więc w środowiskach takich jak Azure DB, na przykład, a nawet RDS, możemy również pobierać dane z tych środowisk.
Istnieje więc duża elastyczność i wiele możliwości odpowiedzi na te pytania, ponieważ dotyczą one innych rodzajów środowisk, do których zmierzamy. Wciąż jest wiele pytań na ten temat, a kiedy widzimy, jak ludzie konsolidują te środowiska, będą musieli także móc odpowiedzieć na te pytania. To całkiem niezły przegląd, powiedziałbym, Menedżera diagnostycznego, ponieważ odnosi się do tego tematu. Wiem, że pojawił się temat wywiadu gospodarczego, a my mamy również narzędzie do wywiadu gospodarczego, o którym dzisiaj nie rozmawialiśmy, ale zapewni ono również wgląd w odpowiedzi na tego rodzaju pytania związane z twoimi pytaniami kostki i wszystkie te różne rodzaje rzeczy. Ale mam nadzieję, że był to dobry przegląd, przynajmniej pod względem tego, jak ten produkt może pomóc w opracowaniu dobrego planu.
Eric Kavanagh: Dobra, dobre rzeczy. Tak, wyrzucę to Rickowi, jeśli nadal tam jest. Rick, masz jakieś pytania?
Rick Sherman: Tak, więc po pierwsze, to jest świetne, podoba mi się. Szczególnie podoba mi się rozszerzenie na maszyny wirtualne i chmury. Widzę, że wielu programistów myśli, że jeśli jest w chmurze, nie musi go dostroić. Więc-
Bullett Manale: Racja, wciąż musimy za to płacić, prawda? Nadal musisz płacić za wszystko, co ludzie umieszczają w chmurze, więc jeśli źle działa lub powoduje wiele cykli procesora, musisz zapłacić więcej pieniędzy, więc to nie ty wciąż absolutnie muszę to zmierzyć.
Rick Sherman: Tak, widziałem wiele słabych projektów w chmurze. Chciałem zapytać, czy ten produkt będzie również używany - wiem, że wspomniałeś o produkcie BI i masz mnóstwo innych produktów, które współdziałają ze sobą - ale czy zacząłbyś przyglądać się wydajności SQL, pojedynczym zapytaniom w tym narzędziu? A może byłyby do tego wykorzystane inne narzędzia?
Bullett Manale: Nie, to absolutnie. To jedna z rzeczy, których nie omawiałem i zamierzałem, to część zapytań. Mamy wiele różnych sposobów identyfikowania wydajności zapytania, niezależnie od tego, czy jest ono powiązane, a konkretnie oczekiwania, jak widzimy w tym widoku, lub czy jest to związane z ogólnym zużyciem zasobów przez zapytania, istnieje wiele sposobów analizowania zapytania występ. Chodzi o to, czy jest to czas trwania, procesor, operacje we / wy i po raz kolejny możemy również spojrzeć na same obciążenia, aby uzyskać wgląd. Możemy podać zalecenia w sekcji analizy, a także mamy wersję internetową, która zawiera informacje dotyczące samych zapytań. Mogę więc uzyskać rekomendacje dotyczące brakujących indeksów oraz możliwość przeglądania planu wykonania i tego rodzaju rzeczy; jest to również możliwość. Tak więc absolutnie możemy zdiagnozować zapytania na siedem sposobów do niedzieli (śmiech) i być w stanie zapewnić ten wgląd w liczbę wykonań, czy to zużycie zasobów, oczekiwania, czas trwania, wszystkie te dobre rzeczy.
Rick Sherman: OK, świetnie. A jakie jest obciążenie samych instancji z całym tym monitorowaniem?
Bullett Manale: To dobre pytanie. Wyzwanie związane z odpowiedzią na to pytanie polega na tym, że to zależy, tak jak wszystko inne. Wiele z tego, co ma do zaoferowania nasze narzędzie, zapewnia elastyczność, a częścią tej elastyczności jest to, że możesz powiedzieć mu, co należy zbierać, a czego nie. Na przykład w przypadku samych zapytań nie muszę zbierać informacji o oczekiwaniu ani nie mogę. Potrafię zbierać informacje związane z zapytaniami, które przekraczają czas wykonania. Jako przykład tego, gdybym wszedł do konfiguracji monitora zapytań i powiedziałbym: „Zmieńmy tę wartość na zero”, rzeczywistość jest taka, że po prostu sprawia, że narzędzie zbiera każde uruchomione zapytanie, a tak naprawdę nie duch tego, dlaczego tak jest, ale ogólnie mówiąc, gdybym chciał podać pełną próbkę danych dla wszystkich zapytań, mógłbym to zrobić.
Jest to więc bardzo zależne od tego, jakie są twoje ustawienia, mówiąc ogólnie, po wyjęciu z pudełka. Jest to od około 1–3 procent kosztów ogólnych, ale obowiązują inne warunki. Zależy to również od tego, ile zapytań o porty są uruchomione w twoim środowisku, prawda? Zależy to również od metody zbierania tych zapytań i od wersji SQL. Na przykład, SQL Server 2005, nie będziemy w stanie wyciągnąć z rozszerzonych zdarzeń, podczas gdy by to zrobić. Tak więc byłoby trochę inaczej pod względem sposobu, w jaki chcielibyśmy zebrać te dane, ale to powiedziało, jak powiedziałem, jesteśmy tutaj, bo chyba od 2004 roku z tym produktem. Minęło już sporo czasu, mamy tysiące klientów, więc ostatnią rzeczą, którą chcemy zrobić, jest narzędzie do monitorowania wydajności, które powoduje problemy z wydajnością (śmiech). Staramy się więc unikać tego w jak największym stopniu, ale ogólnie rzecz biorąc, około 1–3 procent jest dobrą zasadą.
Rick Sherman: OK, i to dość nisko, więc to wspaniale.
Eric Kavanagh: Dobrze. Robin, masz jakieś pytania?
Robin Bloor: Przepraszam, byłem wyciszony. Masz możliwość korzystania z wielu baz danych, a mnie interesuje to, w jaki sposób możesz przeglądać wiele baz danych, dzięki czemu możesz wiedzieć, że większa baza zasobów jest prawdopodobnie podzielona między różne maszyny wirtualne i tak dalej. Interesuje mnie, w jaki sposób ludzie faktycznie tego używają. Interesuje mnie to, co robią klienci. Bo to mi się wydaje, no cóż, z pewnością, kiedy bałam się bazami danych, coś, czego nigdy nie miałem pod ręką. I rozważałbym tylko jeden przypadek w jakikolwiek sensowny sposób w danym momencie. Jak ludzie to wykorzystują?
Bullett Manale: Mówiąc ogólnie, chodzi o samo narzędzie? Jak tego używają? Chodzi mi ogólnie o to, aby mieć centralny punkt obecności środowiska. Mając spokój i wiedząc, że jeśli patrzą na ekran i widzą zieleń, wiedzą, że wszystko jest dobrze. Dzieje się tak, gdy pojawiają się problemy i oczywiście większość przypadków z perspektywy DBA, wiele razy te problemy pojawiają się, gdy znajdują się przed konsolą, dzięki czemu można być powiadamianym, gdy tylko problem się pojawi. Ale oprócz tego, będąc w stanie zrozumieć, kiedy problem się zdarza, być w stanie dotrzeć do sedna informacji, która zapewnia im pewien kontekst, dlaczego tak się dzieje. I tak myślę, że to najważniejsza część: bycie proaktywnym w tym zakresie, nie bycie reaktywnym.
Większość DBA, z którymi rozmawiam - i nie wiem, to spory procent z nich - niestety wciąż są w reaktywnym środowisku; czekają, aż konsument podejdzie do nich i powie im, że jest problem. Widzimy więc wielu ludzi próbujących się oderwać od tego i myślę, że to duża część powodu, dla którego ludzie lubią to narzędzie, ponieważ pomaga im być aktywnym, ale zapewnia im również wgląd w to, co się dzieje, na czym polega problem, ale w wielu przypadkach co najmniej znajdujemy - a może to tylko DBA nam to mówi - ale DBA, postrzeganie jest zawsze ich problemem, nawet jeśli to programista aplikacji napisał aplikację który nie napisał tego poprawnie, to oni ponoszą winę, ponieważ biorą tę aplikację do swoich systemów lub serwerów, a następnie, gdy wydajność jest niska, wszyscy wskazują na DBA: „Hej, to twoja wina.”
To narzędzie jest często używane, aby pomóc DBA w stwierdzeniu: „Hej, tu leży problem, a nie ja.” (Śmiech) Musimy popraw to, niezależnie od tego, czy będzie to zmiana zapytań, czy cokolwiek to może być. W niektórych przypadkach spadnie to do ich zakresu odpowiedzialności, ale przynajmniej będzie miało narzędzie, które pomoże im to zrozumieć i wiedzieć o tym, a robienie tego w odpowiednim czasie jest oczywiście idealnym podejściem.
Robin Bloor: Tak, większość stron, które znam, ale minęło trochę czasu, odkąd tam byłem, przeglądając różne witryny z wieloma bazami danych, ale przede wszystkim to, co kiedyś znajdowałem, to to, że będą DBA, które koncentrowały się na kilku bazach danych. I to byłyby bazy danych, które gdyby kiedykolwiek upadły, byłby to naprawdę duży problem dla biznesu i tak dalej. A inni zbierają statystyki co jakiś czas, aby zobaczyć, że nie zabrakło im miejsca i nigdy na nich nie spojrzą. Podczas gdy robiłeś wersję demo, patrzyłem na to i myślałem dobrze, w taki czy inny sposób, rozszerzasz, po prostu udostępniając coś takiego dla baz danych, o których często nikt się nie przejmował, ponieważ mają one wzrost danych, mają również czasami wzrost aplikacji. Rozszerzasz zasięg DBA w dość dramatyczny sposób. Więc o to tak naprawdę chodzi. Czy to dzięki temu zestawowi narzędzi możesz w końcu dać usługę DBA każdej bazie danych w sieci korporacyjnej?
Bullett Manale: Pewnie, mam na myśli, że wyzwaniem jest to, że, jak powiedziałeś dość elokwentnie, jest to, że istnieją bazy danych, na których dbają DBA, a także takie, na których nie dbają tak bardzo. I sposób, w jaki ten konkretny produkt, sposób, w jaki jest licencjonowany, jest dla poszczególnych instancji. Sądzę, że istnieje próg, kiedy ludzie decydują: „Hej, to nie jest wystarczająco krytyczny przypadek, że chcę nim zarządzać za pomocą tego narzędzia”. To powiedziawszy, istnieją inne narzędzia, które robimy Mam ich więcej, tak myślę, dostosowując się do tych mniej ważnych wystąpień SQL. Jednym z nich byłby Menedżer zapasów, w którym przeprowadzamy lekkie kontrole kondycji względem instancji, ale oprócz tego robimy odkrycie, więc identyfikujemy nowe instancje, które zostały wprowadzone do Internetu, a następnie, od tego momentu, jako DBA mogę powiedzieć: „OK, oto nowa instancja SQL, czy to teraz Express? Czy jest to wersja bezpłatna, czy wersja korporacyjna? ”Prawdopodobnie to pytanie, które chcę sobie zadać, ale po drugie, jak ważna jest dla mnie ta instancja? Jeśli to nie jest tak ważne, mogę uruchomić to narzędzie i zrobić to, ogólne, co nazwałbym ogólnymi sprawdzeniami kondycji w tym sensie, że są to podstawowe rodzaje rzeczy, na których mi zależy jako DBA: Czy dysk się zapełnia ? Czy serwer reaguje na problemy? Najważniejsze rzeczy, prawda?
Podczas gdy w narzędziu Diagnostic Manager, narzędzie, które właśnie wam pokazałem, przejdzie do poziomu zapytania, przejdzie do rekomendacji indeksów, patrząc na plan wykonania i wszystkie inne dobre rzeczy, podczas gdy jest to głównie skoncentrowane kto jest właścicielem tego, co ja posiadam i kto jest za to odpowiedzialny? Jakie mam dodatki Service Pack i poprawki? I czy moje serwery działają z głównymi składnikami tego, co uważam za zdrową instancję SQL? Aby odpowiedzieć na twoje pytanie, jest trochę mieszanki. Kiedy ludzie patrzą na to narzędzie, zwykle patrzą na bardziej krytyczny zestaw instancji. To powiedziawszy, mamy ludzi, którzy kupują każdą instancję i zarządzają nią, więc to po prostu zależy. Ale mówię, ogólnie rzecz biorąc, zdecydowanie istnieje próg dla tych ludzi, którzy uważają, że ich środowisko jest wystarczająco ważne, aby mieć takie narzędzie do zarządzania tymi instancjami.
Robin Bloor: Dobra, kolejne pytanie, zanim przekażę je Ericowi. Odnosząc wrażenie, po obejrzeniu branży, można odnieść wrażenie, że bazy danych wciąż mają życie, ale wszystkie dane wlewają się do wszystkich tych jezior danych i tak dalej. To naprawdę szum, a szum nigdy nie odzwierciedla rzeczywistości, więc interesuje mnie, jaką rzeczywistość tam widzisz? Czy ważne są bazy danych w organizacji, czy doświadczają tradycyjnego wzrostu danych, o którym myślałem, że to 10 procent rocznie? A może rosną jeszcze bardziej? Czy duże zbiory danych powodują, że te bazy danych są balonami? Jakie widzisz zdjęcie?
Bullett Manale: Myślę, że w wielu przypadkach widzimy przeniesienie niektórych danych do tych innych segmentów, w których ma to większy sens, gdy dostępne są inne technologie. Od niedawna niektóre z większych danych. Ale te bazy danych, powiedziałbym, trudno jest uogólnić w wielu przypadkach, ponieważ każdy jest trochę inny. Ogólnie jednak widzę pewne rozbieżności. Widzę, jak powiedziałem, ludzie w wielu przypadkach przechodzą na modele elastyczne, ponieważ chcą zwiększyć zasoby, a nie tyle w innych obszarach. Niektórzy ludzie przenoszą się do dużych zbiorów danych. Ale trudno jest poczuć, jak mówisz, postrzeganie, ponieważ ogólnie ludzie, z którymi rozmawiam, mają tradycyjne bazy danych i używają tego w środowisku SQL Server.
Powiedziałbym, że jeśli chodzi o sam SQL, zdecydowanie nadal uważam, że zyskuje on udział w rynku. I myślę, że wielu ludzi nadal wybiera SQL z innych miejsc, takich jak Oracle, ponieważ jest to bardziej przystępne cenowo i wydaje się być oczywiste, ponieważ wersje SQL stają się bardziej zaawansowane - i widać to z nowszymi rzeczami, które nadal używają SQL, jeśli chodzi o szyfrowanie i wszystkie inne możliwości, które czynią go środowiskiem lub platformą bazy danych - to oczywiście bardzo ważne z punktu widzenia misji. Myślę, że też to widzimy. Gdzie widzisz zmianę, nadal się dzieje. Mam na myśli, że działo się to 10 lat temu, tak myślę, dzieje się nadal w kategoriach SQL Server, gdzie środowisko rośnie, a udział w rynku rośnie.
Robin Bloor: OK, Eric, zakładam, że publiczność ma pytanie czy dwa?
Eric Kavanagh: Tak, pozwól mi rzucić ci jeden szybki. Właściwie to całkiem dobre pytanie. Jeden z uczestników pyta, czy to narzędzie powie mi, czy tabela może potrzebować indeksu, aby przyspieszyć zapytanie? Jeśli tak, czy możesz podać przykład?
Bullett Manale: Tak, więc nie wiem, czy mam taki do konkretnego dodawania indeksu, ale możesz zobaczyć tutaj, mamy tutaj rekomendacje dotyczące fragmentacji. Wierzę też, że właśnie to mieliśmy i było to częścią Menedżera diagnostycznego oferującego wersję internetową, w której mówi mi, że brakuje mi indeksu. Możemy przejrzeć te rekomendacje, a to pokaże nam potencjalny zysk z tego, indeksując te informacje. Inną rzeczą, o której powinienem tylko wspomnieć, jest to, że kiedy wykonamy zalecenia, dla wielu z nich skrypt zostanie dla niego zbudowany. To nie jest dobry przykład, ale można by zobaczyć, tak, sytuacje, w których indeks - albo duplikat indeksu, albo dodanie indeksu - poprawiłby wydajność, i jak powiedziałem wcześniej, robimy dużo że poprzez hipotetyczną analizę indeksu. Tak więc naprawdę pomaga w zrozumieniu obciążenia pracą, aby móc zastosować to do zalecenia.
Eric Kavanagh: To świetne rzeczy, co da mi dobry przykład do ostatnich komentarzy tutaj. Robin, ja i Rick, słyszeliśmy już od wielu lat, mówi się o samodostrajających się bazach danych. To samodostrajająca się baza danych! Mogę ci tylko powiedzieć: nie wierz im.
Bullett Manale: Nie wierz w szum.
Eric Kavanagh: Może być kilka drobnych rzeczy, które robią się dynamicznie, ale nawet to, możesz chcieć to sprawdzić i upewnić się, że nie robi czegoś, czego nie chcesz. Tak więc od pewnego czasu będziemy potrzebować takich narzędzi, aby zrozumieć, co dzieje się na poziomie bazy danych i jak powiedział Robin, jeziora danych to fascynujące koncepcje, ale prawdopodobnie istnieje tak duża szansa na ich przejęcie, jak w najbliższym czasie będzie potwór z Loch Ness. Powiedziałbym więc raz jeszcze, że w prawdziwym świecie jest dużo technologii baz danych, potrzebujemy ludzi, DBA, aby popatrzeć na te rzeczy i je zsyntetyzować. Możesz powiedzieć, że musisz wiedzieć, co robisz, aby te rzeczy działały. Ale potrzebujesz narzędzi, które dostarczą ci informacji, aby wiedzieć, co robisz. Podsumowując, DBA mają się dobrze.
I wielkie podziękowania dla Bullett Manale i naszych przyjaciół z IDERA. I oczywiście Rick Sherman i Robin Bloor. Archiwizujemy wszystkie te webcasty, więc wskocz online insideanalysis.com lub do naszej witryny partnerskiej www.techopedia.com, aby uzyskać więcej informacji na ten temat.
I dzięki temu pożegnamy się, ludzie. Dzięki jeszcze raz, porozmawiamy z tobą następnym razem. Dbać. PA pa.