Spisu treści:
Definicja - Co oznacza Big Data?
Big data odnosi się do procesu stosowanego, gdy tradycyjne techniki eksploracji i obsługi danych nie mogą odkryć wglądu i znaczenia danych bazowych. Dane, które są nieustrukturyzowane, wrażliwe na czas lub po prostu bardzo duże, nie mogą być przetwarzane przez silniki relacyjnych baz danych. Ten typ danych wymaga innego podejścia do przetwarzania zwanego big data, które wykorzystuje masywną równoległość na łatwo dostępnym sprzęcie.
Techopedia wyjaśnia Big Data
Po prostu, duże zbiory danych odzwierciedlają zmieniający się świat, w którym żyjemy. Im więcej rzeczy się zmienia, tym bardziej zmiany są rejestrowane i rejestrowane jako dane. Weźmy za przykład pogodę. Dla prognozy pogody ilość danych zebranych na całym świecie na temat warunków lokalnych jest znaczna. Logicznie rzecz biorąc, sensowne byłoby, aby lokalne środowiska dyktowały skutki regionalne, a efekty regionalne dyktowały skutki globalne, ale może być odwrotnie. Tak czy inaczej, te dane pogodowe odzwierciedlają atrybuty dużych zbiorów danych, gdzie przetwarzanie w czasie rzeczywistym jest potrzebne dla ogromnej ilości danych i gdzie można wygenerować dużą liczbę danych wejściowych, osobistych obserwacji lub sił zewnętrznych, takich jak plamy słoneczne.
Przetwarzanie takich informacji pokazuje, dlaczego duże zbiory danych stały się tak ważne:
- Większość zebranych danych jest nieustrukturyzowana i wymaga innego przechowywania i przetwarzania niż w tradycyjnych relacyjnych bazach danych.
- Dostępna moc obliczeniowa gwałtownie rośnie, co oznacza, że istnieje więcej możliwości przetwarzania dużych zbiorów danych.
- Internet zdemokratyzował dane, stale zwiększając dostępne dane, jednocześnie wytwarzając coraz więcej surowych danych.
Dane w postaci surowej nie mają wartości. Dane muszą być przetwarzane, aby były cenne. Jednak w tym tkwi nieodłączny problem dużych zbiorów danych. Czy przetwarzanie danych z macierzystego formatu obiektowego do użytecznego wglądu jest warte ogromnych kosztów kapitałowych? A może jest zbyt wiele danych o nieznanych wartościach, aby uzasadnić hazard przetwarzania ich za pomocą narzędzi do dużych zbiorów danych? Większość z nas zgodziłaby się z tym, że będąc w stanie przewidzieć, że pogoda będzie miała wartość, pytanie brzmi, czy ta wartość może przeważyć koszty zebrania wszystkich danych w czasie rzeczywistym w raporcie pogodowym, na którym można liczyć.




