P:
Więcej nie zawsze jest lepsze. W jaki sposób organizacje mogą zmniejszyć hałas w swoich danych, aby uzyskać ukierunkowane, dokładne analizy?
ZA:W przypadku systemów dużych zbiorów danych jedno z głównych pytań dla firm dotyczy tego, jak dobrze ukierunkować te projekty i zapewnić ich skuteczność. Wiele narzędzi i zasobów zbudowanych dla dużych zbiorów danych zbudowano w celu odsysania ogromnych ilości informacji w szerokiej sieci. Nie zawsze zwracają uwagę na uszlachetnianie tych danych i upraszczanie ich. Istnieją jednak najlepsze praktyki pojawiające się w branży w celu tworzenia bardziej ukierunkowanych i przydatnych projektów dużych zbiorów danych.
Jednym z filarów ukierunkowanego podejścia do dużych zbiorów danych jest wykorzystanie odpowiednich narzędzi i zasobów oprogramowania. Nie wszystkie systemy analityczne i big data są takie same. Niektóre z nich mogą skuteczniej odfiltrowywać nadmierne lub nieistotne dane i pozwalają firmom skupić się na podstawowych faktach, które określą ich podstawowe procesy i operacje.
Inna znacząca część tego dotyczy ludzi. Przed zaangażowaniem się w projekt dużych zbiorów danych oraz podczas pozyskiwania oprogramowania dostawcy, realizacji i szkolenia innych, centralna grupa ludzi musi być odpowiedzialna za ten proces, a także delegować zadania badawcze i burze mózgów. Może to sprawić, że podejście do dużych zbiorów danych stanie się precyzyjną, chirurgiczną metodą, która usprawni działalność, nie stając się zbyt ciężkim i nie zakłócając codziennych operacji.
Na przykład grupy zadaniowe lub inne podstawowe grupy mogą usiąść i szczegółowo przyjrzeć się sposobom wdrożenia, jak firma zacznie oceniać zbiory danych, jak będą indeksować konta, jaki rodzaj papieru lub prezentacje cyfrowe wykorzystają do rozpowszechnienia tych informacji, w jaki sposób będą tworzyć użyteczne raporty itp. Dane te ochronią firmę przed rozdęciem dużych zbiorów danych.
Ponadto, w miarę jak firmy zaczynają nabywać więcej usług dostawców, przeprowadzają kradnienie dużych zbiorów danych i komplikują architekturę IT, nauczyły się odróżniać najbardziej wrażliwe dane od wszystkiego innego.
Jednym ze sposobów na to jest stworzenie systemu warstwowego. Na przykład podstawowy zestaw danych identyfikatorów klientów i historii może być przechowywany w specjalnie utrzymywanej bazie danych w ramach określonej umowy bezpieczeństwa w chmurze lub na miejscu. Inne zestawy danych mogą znajdować się w mniej wyspecjalizowanych środowiskach danych, ponieważ są mniej wrażliwe pod względem naruszeń danych lub dlatego, że są mniej bezpośrednio związane z analizami przeprowadzanymi przez firmę. Wielopoziomowe lub wielopoziomowe systemy pozwalają na ekonomiczne wdrożenie dużych zbiorów danych.
Oto niektóre ze sposobów, w jakie firmy są inteligentne, jeśli chodzi o pozyskiwanie dużych zbiorów danych we właściwy sposób. Zamiast odkurzać wszystkie dane, które mogą pobrać, traktują niektóre zestawy danych jako najbardziej krytyczne, aby uzyskać jak najwięcej informacji biznesowych przy najmniejszym wysiłku.