Dom Trendy Co to jest apache avro? - definicja z techopedia

Co to jest apache avro? - definicja z techopedia

Spisu treści:

Anonim

Definicja - Co oznacza Apache Avro?

Apache Avro to platforma do serializacji danych i zdalnego wywoływania procedur, która została opracowana w ramach projektu Apache Hadoop, gdzie zapewnia zarówno format serializacji w celu uzyskania trwałych danych, jak i format przewodowy do komunikacji między węzłami Hadoop, a także do łączenia programów klienckich z Hadoop usługi.

Avro używa formatu JSON do definiowania protokołów i typów danych, a także serializuje dane do kompaktowego formatu binarnego.

Techopedia wyjaśnia Apache Avro

Apache Avro to platforma do serializacji dużych zbiorów danych, która wytwarza dane w kompaktowym formacie binarnym, który nie wymaga generowania kodu ani obiektów proxy.

Jest używany jako składnik serializacji danych dla Apache Hadoop. Avro pracuje nad koncepcją schematów. Podczas odczytywania danych Avro zawsze występuje schemat użyty podczas zapisywania tych konkretnych danych.

To pozwala każdemu zestawowi danych bez kosztów ogólnych na wartość, co sprawia, że ​​serializacja jest zarówno szybka, jak i stosunkowo niewielka. A ponieważ dane i ich schemat są w pełni samoopisujące, ułatwia to korzystanie z dynamicznych języków skryptowych.

Gdy dane Avro są przechowywane w określonym pliku, schemat jest również zapisywany wraz z nimi do późniejszego przetworzenia przez inny program. Jeśli więc program odczytujący dane oczekuje innego schematu, można to łatwo rozwiązać, ponieważ oba schematy są obecne.

Avro zapewnia:

    Kompaktowy i szybki format danych binarnych

    Bogate struktury danych

    Plik kontenera do przechowywania trwałych danych

    Zdalne wywołanie procedury (RPC)

    Integracja z dynamicznymi językami

Generowanie kodu nie jest wymagane do odczytu lub zapisu plików danych ani do używania lub implementowania protokołów RPC.

Co to jest apache avro? - definicja z techopedia