Spisu treści:
Definicja - Co oznacza platforma analizy danych?
Platforma analizy danych pomaga w wykonywaniu operacji na analizie danych jako kompletny pakiet. W celu przeprowadzenia analizy danych i uzyskania przydatnego wglądu w ogromne ilości danych wykorzystywane są określone narzędzia. Narzędzia te działają zasadniczo jako dane jako narzędzie platformy.
Techopedia wyjaśnia platformę analizy danych
Platforma analizy danych obsługuje aplikacje intensywnie przetwarzające dane i może jednocześnie obsługiwać klastry sprzętowe. Działają przy użyciu zestawu ogólnych prymitywów w celu przeprowadzenia analizy w czasie rzeczywistym.
Obecnie na rynku dostępne są różne platformy analizy danych. Oto kilka z nich:
- Hadoop: jest to dobrze znane narzędzie typu open source dla dużych zbiorów danych, które jest licencjonowane na licencji Apache v2. Hadoop jest wysoce skalowalny i niezawodny i działa na modelu obliczeniowym MapReduce.
- Storm: Storm jest własnością Twittera i działa prawie tak samo jak Hadoop.
- Spark: Jest to platforma analityki danych typu open source opracowana w AMPLab. Apache Spark jest szybki i może uruchamiać programy 100 razy szybciej niż Hadoop.
- MapReduce: MapReduce działa równolegle, przetwarzając dużą ilość danych.
