Spisu treści:
Definicja - Co oznacza Hadoop YARN?
Hadoop YARN jest specyficznym składnikiem platformy Hadoop typu open source do analizy dużych zbiorów danych, licencjonowanej przez fundację non-profit Apache Foundation.
Główne składniki Hadoop to centralny system biblioteczny, system obsługi plików HDFS Hadoop oraz Hadoop MapReduce, który jest zasobem do przetwarzania danych wsadowych. Oprócz nich istnieje platforma Hadoop YARN, która jest opisana jako platforma klastrowania, która pomaga zarządzać zasobami i planować zadania. Fundacja oprogramowania Apache, właściciel licencji dla Hadoop, opisuje Hadoop YARN jako „MapReduce nowej generacji” lub „MapReduce 2.0”.
Techopedia wyjaśnia Hadoop YARN
Eksperci wyjaśniają, że kluczowa koncepcja YARN obejmuje konfigurowanie zarówno globalnych, jak i specyficznych dla aplikacji komponentów zarządzania zasobami. Pomaga to przydzielić zasoby do poszczególnych aplikacji i zarządzać innymi rodzajami zadań monitorowania zasobów. W YARN klient przesyłania aplikacji przesyła aplikację do menedżera zasobów YARN. YARN „planuje” aplikacje w celu ustalenia priorytetów zadań i utrzymania systemów analizy dużych zbiorów danych. To tylko jedna część większej architektury do agregowania i sortowania danych, przeprowadzania określonych zapytań w celu odzyskania danych, a także używania Hadoop i powiązanych narzędzi do manipulowania dużymi danymi w celu analizy biznesowej i wiele więcej. Firmy używają tego rodzaju platform do przeglądania łańcuchów dostaw, dokumentowania operacji i usług, śledzenia informacji o klientach oraz wielu innych rodzajów potężnych, opartych na danych i zautomatyzowanych procesów biznesowych.