Czesanie źródeł danych w Hadoop to złożony biznes. Niektóre z tego przyczyn to:
- Problematyczne są niestandardowe skrypty właściwe dla źródła łączące źródła danych.
- Korzystanie z narzędzi do integracji danych lub analizy danych wprowadza zbyt dużą niepewność.
- Dodawanie danych ze źródeł zewnętrznych jest prawie niemożliwe.
Dzisiaj omówię, w jaki sposób analityka Hadoop jest ulepszana poprzez technologie niezależne od źródła, które ułatwiają łączenie wewnętrznych i zewnętrznych źródeł danych. Oprócz opisu działania metod niezależnych od źródła, omówię również, dlaczego analizy Hadoop potrzebują wbudowanych funkcji inteligencji i transferu wiedzy, zrozumienia relacji i charakterystyki danych oraz skalowalnej i wysokowydajnej architektury.
Seminarium internetowe: Matryce znaczenia: Łączenie kropek w Hadoop - Zarejestruj się tutaj |