Dom Audio Czym jest ekosystem hadoop? - definicja z techopedia

Czym jest ekosystem hadoop? - definicja z techopedia

Spisu treści:

Anonim

Definicja - Co oznacza ekosystem Hadoop?

Ekosystem Hadoop odnosi się do różnych składników biblioteki oprogramowania Apache Hadoop, a także do akcesoriów i narzędzi dostarczanych przez Apache Software Foundation dla tego typu projektów oprogramowania oraz sposobów ich współpracy.

Hadoop to platforma oparta na Javie, która jest niezwykle popularna do obsługi i analizowania dużych zestawów danych.

Techopedia wyjaśnia ekosystem Hadoop

Zarówno podstawowy pakiet Hadoop, jak i jego akcesoria to głównie projekty typu open source na licencji Apache. Idea ekosystemu Hadoop polega na wykorzystaniu różnych części podstawowego zestawu Hadoop, takich jak MapReduce, platforma do obsługi ogromnych ilości danych oraz Hadoop Distributed File System (HDFS), wyrafinowany system obsługi plików. Istnieje również YARN, menedżer zasobów Hadoop.

Oprócz tych podstawowych elementów Hadoop, Apache dostarczył również inne akcesoria lub narzędzia uzupełniające dla programistów. Należą do nich Apache Hive, narzędzie do analizy danych; Apache Spark, ogólny silnik do przetwarzania dużych zbiorów danych; Apache Pig, język przepływu danych; HBase, narzędzie bazy danych; a także Ambarl, który można uznać za menedżera ekosystemu Hadoop, ponieważ pomaga on wspólnie zarządzać korzystaniem z różnych zasobów Apache. Gdy Hadoop stał się de facto standardem gromadzenia danych i stał się wszechobecny w wielu organizacjach, menedżerowie i liderzy ds. Rozwoju dowiadują się wszystkiego o ekosystemie Hadoop i o tym, jakie rzeczy są związane z ogólną konfiguracją Hadoop.

Czym jest ekosystem hadoop? - definicja z techopedia