Spisu treści:
- Definicja - Co oznacza ekstrakcja obciążenia transformacji (ETL)?
- Techopedia wyjaśnia Extract Transform Load (ETL)
Definicja - Co oznacza ekstrakcja obciążenia transformacji (ETL)?
Wyodrębnij obciążenie transformacji (ETL) to proces ekstrakcji, transformacji i ładowania podczas korzystania z bazy danych, ale szczególnie podczas korzystania z przechowywania danych. Obejmuje następujące podprocesy:
- Pobieranie danych z zewnętrznych źródeł danych lub źródeł transmisji
- Przekształcanie danych do zrozumiałego formatu, w którym dane są zwykle przechowywane wraz z kodem wykrywania błędów i kodem korekcji w celu spełnienia potrzeb operacyjnych
- Przesyłanie i ładowanie danych do końca odbierającego
Techopedia wyjaśnia Extract Transform Load (ETL)
Pierwsza faza procesu ETL koncentruje się na odzyskiwaniu danych ze źródła pamięci. Większość projektów przechowywania danych integruje dane otrzymane z różnych systemów źródłowych. Każdy indywidualny system może wykorzystywać osobną organizację danych lub format. Typowymi strukturami źródeł danych są relacyjne bazy danych i czyste pliki danych. Mogą również obejmować nierelacyjne wzorce baz danych, takie jak systemy zarządzania informacjami lub inne struktury danych, takie jak metoda wirtualnego dostępu do pamięci masowej (VSAM) lub indeksowana metoda sekwencyjnego dostępu (ISAM). Źródła danych mogą nawet obejmować źródła zewnętrzne, takie jak dane pochodzące z Internetu lub za pośrednictwem systemu skanującego.
Faza transformacji wykorzystuje szereg reguł lub operacji w celu pobrania czystych danych ze źródła w celu dostarczenia danych w ostatecznej formie do manipulacji na końcu odbierającym. Niektóre źródła danych wymagają bardzo niewielkiego przetwarzania danych lub nawet go wcale. Czasami jedna lub więcej transformacji może mieć kluczowe znaczenie dla dopasowania biznesowych i technicznych wymagań docelowej bazy danych.
Etap ładowania lub transmisji ma na celu wysyłanie danych do końca odbierającego, który prawdopodobnie będzie przechowywaniem danych. W zależności od potrzeb aplikacji proces ten może być bardzo prosty lub bardzo skomplikowany. Niektóre metody przechowywania danych mogą zastępować stare dane danymi zbiorczymi. Aktualizacja wyodrębnionych danych odbywa się zwykle okresowo.
