Dom Audio Jak mogę nauczyć się korzystać z hadoopa do analizy dużych zbiorów danych?

Jak mogę nauczyć się korzystać z hadoopa do analizy dużych zbiorów danych?

Anonim

P:

Jak mogę nauczyć się korzystać z Hadoop do analizy dużych zbiorów danych?

ZA:

Zestaw oprogramowania Apache znany jako Hadoop staje się bardzo popularnym zasobem do obsługi zestawów dużych zbiorów danych. Ten typ oprogramowania do obsługi danych został zbudowany w celu ułatwienia agregacji danych w określony sposób, w oparciu o projekty, które mogą zwiększyć wydajność niektórych projektów danych. To powiedziawszy, Hadoop jest tylko jednym z wielu narzędzi do obsługi dużych zestawów danych.

Jednym z pierwszych i najbardziej podstawowych sposobów uczenia się o analizie dużych zbiorów danych za pomocą Hadoop jest zrozumienie niektórych składników Hadoop najwyższego poziomu i tego, co robi. Należą do nich „platforma zarządzania zasobami” Hadoop YARN, którą można zastosować do niektórych rodzajów konfiguracji sieci, a także zestaw funkcji Hadoop MapReduce, które mają zastosowanie do dużych zbiorów danych. Istnieje również rozproszony system plików Hadoop (HDFS), który pomaga przechowywać dane w różnych systemach rozproszonych, dzięki czemu można je szybko i skutecznie indeksować lub odzyskiwać.

Poza tym ci, którzy chcą lepiej poznać Hadoop, mogą zapoznać się z indywidualnymi opublikowanymi zasobami dla profesjonalistów, którzy wyjaśniają oprogramowanie na odpowiednim poziomie. Ten przykład autorstwa Chrisa Stucchio na osobistym blogu zawiera doskonały zestaw punktów na temat platformy Hadoop i skali danych. Jednym z podstawowych założeń jest to, że Hadoop może być częściej używany niż to konieczne i może nie być najlepszym rozwiązaniem dla indywidualnego projektu. Przejrzenie tego rodzaju zasobów pomoże profesjonalistom zapoznać się ze szczegółami korzystania z Hadoop w danym scenariuszu. Stucchio zapewnia także metafory dotyczące powiązania funkcji Hadoop z konkretnymi zadaniami fizycznymi. Tutaj przykładem jest liczenie książek w bibliotece, podczas gdy funkcja Hadoop może podzielić tę bibliotekę na sekcje, zapewniając indywidualne liczby, które są połączone w jeden wynik danych zbiorczych.

Bardziej dogłębnym sposobem, dzięki któremu specjaliści mogą dowiedzieć się więcej o Hadoop i jego zastosowaniu do dużych zbiorów danych, są specjalne zasoby szkoleniowe i programy. Na przykład firma zajmująca się uczeniem online Cloudera, wybitny dostawca zdalnych sesji szkoleniowych, ma wiele interesujących opcji dotyczących korzystania z Hadoop i podobnych rodzajów przetwarzania danych.

Jak mogę nauczyć się korzystać z hadoopa do analizy dużych zbiorów danych?