Spisu treści:
Definicja - Co oznacza profilowanie danych?
Profilowanie danych to technika stosowana do badania danych do różnych celów, takich jak określenie dokładności i kompletności. Ten proces bada źródło danych, takie jak baza danych, aby odkryć błędne obszary w organizacji danych. Wdrożenie tej techniki poprawia jakość danych.
Profilowanie danych jest również nazywane wykrywaniem danych.
Techopedia wyjaśnia profilowanie danych
Profilowanie danych to metoda badania danych dostępnych w źródle danych oraz gromadzenia statystyk i informacji o tych danych. Takie statystyki pomagają zidentyfikować wykorzystanie i jakość danych metadanych. Ta metoda jest szeroko stosowana w hurtowniach danych przedsiębiorstwa.
Profilowanie danych wyjaśnia strukturę, relacje, treść i zasady wyprowadzania danych, które pomagają w zrozumieniu anomalii w metadanych. Profilowanie danych wykorzystuje różne rodzaje statystyki opisowej, w tym średnią, minimum, maksimum, percentyl, częstotliwość i inne agregaty, takie jak liczba i suma. Dodatkowe informacje metadane uzyskane podczas profilowania to typ danych, długość, wartości dyskretne, unikatowość i rozpoznawanie typów abstrakcyjnych.
