Spisu treści:
Tylko dzięki analizie dużych zbiorów danych rzeczywista wartość dużych zbiorów danych staje się jasna. Te analizy wymagają jednak wiedzy statystycznej i technicznej do wdrożenia dowolnego rozwiązania dużych zbiorów danych. Założono więc, że musisz być naukowcem danych, aby uzyskać znaczący wgląd z dużych zbiorów danych. W tym miejscu wkracza Apache Drill. Zapewnia on elastyczność w zakresie analizy dużych zbiorów danych w Hadoop bez konieczności posiadania wiedzy specjalisty ds. Danych.
Apache Drill - co to jest?
Apache Drill to platforma programowa, która może przesyłać duże dane i dostarczać potrzebnych informacji, ukrywając się pod petabajtami zestawów danych. Z technicznego punktu widzenia Apache Drill jest otwartym, standardowym ANSI SQL, który może być używany jako silnik zapytań o niskim opóźnieniu w popularnej platformie programistycznej Hadoop opartej na Javie.
Może także współpracować ze stadem dobrze prosperujących baz danych NoSQL, takich jak MongoDB, HBase, a także z serwerami danych w chmurze, takimi jak Amazon S3 i Google Cloud Storage. Dodane do nich, bije także poziom innych standardowych interfejsów API (interfejsów programowania aplikacji), takich jak ODBC / JDBC i RESTful API.