Przewodnik po jeziorze danych: co, dlaczego i jak z jeziora danych

2026

W przeszłości, myśląc o danych cyfrowych, sensowne było segregowanie danych między danymi transakcyjnymi, danymi przechwyconymi w aplikacjach biznesowych, przechowywanymi w tabelach baz danych i prezentowanymi przez narzędzia BI oraz wszystkimi innymi danymi: e-mailami, stronami internetowymi, obrazami, wideo i tak dalej. Obecnie mamy tendencję do określania takich „innych danych” jako dane nieustrukturyzowane.

Niemniej jednak było możliwe do przeanalizowania, a oprogramowanie do uzyskiwania wartości z takich danych przekroczyło przepaść. Właśnie ten analityczny imperatyw bardziej niż cokolwiek innego zrodził pierwotną koncepcję jeziora danych, magazynu danych dla obu gatunków danych, a dodatkowo dla danych zebranych z wielu źródeł zewnętrznych dla firmy, z których część była nieuchronnie nieuporządkowana.

W tym artykule zbadamy, w jaki sposób nowy ekosystem utworzony przez jezioro danych nie będzie już składał się wyłącznie z transakcji (lub zdarzeń) firmy. Obejmie również dane z innych źródeł, które firma wykorzystuje do przeprowadzania analiz i informuje użytkowników o ważnych informacjach, na których mogą opierać się decyzje. Systemem zapisu będzie, jak zawsze, złota kopia danych korporacyjnych i ścieżka audytu działań informatycznych firmy.