Spisu treści:
Definicja - Co oznacza Apache Avro?
Apache Avro to platforma do serializacji danych i zdalnego wywoływania procedur, która została opracowana w ramach projektu Apache Hadoop, gdzie zapewnia zarówno format serializacji w celu uzyskania trwałych danych, jak i format przewodowy do komunikacji między węzłami Hadoop, a także do łączenia programów klienckich z Hadoop usługi.
Avro używa formatu JSON do definiowania protokołów i typów danych, a także serializuje dane do kompaktowego formatu binarnego.
Techopedia wyjaśnia Apache Avro
Apache Avro to platforma do serializacji dużych zbiorów danych, która wytwarza dane w kompaktowym formacie binarnym, który nie wymaga generowania kodu ani obiektów proxy.
Jest używany jako składnik serializacji danych dla Apache Hadoop. Avro pracuje nad koncepcją schematów. Podczas odczytywania danych Avro zawsze występuje schemat użyty podczas zapisywania tych konkretnych danych.
To pozwala każdemu zestawowi danych bez kosztów ogólnych na wartość, co sprawia, że serializacja jest zarówno szybka, jak i stosunkowo niewielka. A ponieważ dane i ich schemat są w pełni samoopisujące, ułatwia to korzystanie z dynamicznych języków skryptowych.
Gdy dane Avro są przechowywane w określonym pliku, schemat jest również zapisywany wraz z nimi do późniejszego przetworzenia przez inny program. Jeśli więc program odczytujący dane oczekuje innego schematu, można to łatwo rozwiązać, ponieważ oba schematy są obecne.
Avro zapewnia:
Kompaktowy i szybki format danych binarnych
Bogate struktury danych
Plik kontenera do przechowywania trwałych danych
Zdalne wywołanie procedury (RPC)
Integracja z dynamicznymi językami
Generowanie kodu nie jest wymagane do odczytu lub zapisu plików danych ani do używania lub implementowania protokołów RPC.




