Spisu treści:
Definicja - Co oznacza Wrangling danych?
Wranglowanie danych to szczególny rodzaj zarządzania danymi, który powstał w wyniku nowych możliwości oprogramowania, wprowadzając duże, niechlujne i różnorodne zestawy danych, które należy wprowadzić do architektury zorientowanej na usługi (SOA) w celu analizy i wykorzystania. Wranglowanie danych zazwyczaj obejmuje wiele różnych wyrafinowanych technik postępowania z nieregularnymi lub różnorodnymi danymi i manipulowania nimi w biznesowych przypadkach użycia.
Techopedia wyjaśnia Wrangling danych
Może to zabrzmieć jak nieformalny termin, ale przekłamywanie danych faktycznie zajmuje określoną przestrzeń w zarządzaniu danymi. Jednym z pomocnych sposobów zrozumienia spisku danych jest porównanie go z często bardziej formalną metodologią ekstrakcji, transformacji i ładowania (ETL). Przenikanie danych ma inne aspekty i przypadki użycia niż ETL. Jest to często wykonywane przez wykwalifikowanych naukowców zajmujących się danymi lub inne osoby w pobliżu rurociągu. Pod pewnymi względami przekręcanie danych można nazwać rodzajem ETL typu „open source”, ponieważ inżynierowie zajmujący się danymi mogą być bardziej „praktyczni” lub używać bardziej ręcznych metod ekstrakcji.
Dla tych, którzy naprawdę rozumieją wyrafinowane procesy, w których różnorodne dane są gromadzone, sortowane i wprowadzane do architektur korporacyjnych, wranglowanie danych jest w rzeczywistości bardzo ważnym tematem. Specjaliści IT przyglądają się szerokiemu wachlarzowi narzędzi, zasobów i technik w celu uzyskania wartości z nieporządnych, surowych lub nieuporządkowanych danych.
