Spisu treści:
Definicja - Co oznacza jakość danych?
Jakość danych to zawiły sposób pomiaru właściwości danych z różnych perspektyw. Jest to kompleksowe badanie wydajności aplikacji, niezawodności i sprawności danych, zwłaszcza danych znajdujących się w hurtowni danych.
W organizacji odpowiednia jakość danych ma zasadnicze znaczenie dla procesów transakcyjnych i operacyjnych, a także dla długowieczności raportowania Business Intelligence (BI) i Business Analytics (BA). Na jakość danych może wpływać sposób, w jaki dane są wprowadzane, przetwarzane i utrzymywane.
Zapewnienie jakości danych (DQA) to procedura mająca na celu sprawdzenie wydajności i niezawodności danych.
Techopedia wyjaśnia jakość danych
Skuteczne utrzymanie jakości danych wymaga okresowego monitorowania i czyszczenia danych. Ogólnie utrzymanie jakości danych obejmuje aktualizację / standaryzację danych i deduplikację rekordów w celu utworzenia pojedynczego widoku danych.
Kluczowe komponenty jakości danych są następujące:
- Kompletność: poziom, na którym dostarczane są pożądane atrybuty danych. Dane nie muszą być w 100% kompletne.
- Dokładność: reprezentuje rzeczywisty status danych. Można obliczyć za pomocą metody automatycznej za pomocą różnych list i map.
- Wiarygodność: zakres, w jakim dane są uważane za wiarygodne i prawdziwe. Może różnić się od źródła.
- Terminowość (wiek danych): zakres, w jakim dane są odpowiednio aktualizowane dla bieżącego przedsięwzięcia.
- Spójność: ocenia, czy różne fakty zestawu danych pasują do siebie.
- Uczciwość: Ocenia poprawność referencji i dokładne łączenie różnych zestawów danych.
Jakość danych jest niezbędna z następujących powodów:
- Zapewnia precyzyjne i aktualne informacje w celu obsługi odpowiedzialności i usług.
- Oferuje szybkie informacje na temat skuteczności usługi.
- Pomaga ustalić priorytety i zagwarantować efektywne wykorzystanie zasobów.
