Spisu treści:
- Definicja - Co oznacza deduplikacja po przetwarzaniu (PPD)?
- Techopedia wyjaśnia deduplikację post-processingu (PPD)
Definicja - Co oznacza deduplikacja po przetwarzaniu (PPD)?
Deduplikacja postprocesowa (PPD) odnosi się do systemu, w którym procesy programowe filtrują zbędne dane z zestawu danych po ich przeniesieniu do miejsca przechowywania danych. Można to również nazwać asynchroniczną deduplikacją i jest często stosowane tam, gdzie menedżerowie uważają, że usunięcie nadmiarowych danych przed lub w trakcie transferu jest nieefektywne lub niewykonalne.
Techopedia wyjaśnia deduplikację post-processingu (PPD)
Deduplikację postprocesową można przeciwstawić praktyce zwanej deduplikacją in-line, w której nadmiarowe dane są usuwane podczas przesyłania danych do przechowywania. Jednym z powodów, dla których administratorzy mogą wybrać metodę deduplikacji postprocesowej, jest to, że deduplikacja bezpośrednia może spowolnić proces przesyłania i utrudnić łatwą i wydajną archiwizację danych.
Chociaż menedżerom lub administratorom może być łatwiej zastosować metodę deduplikacji po zakończeniu procesu, tego typu optymalizacja danych ma swoje wady. Jednym z nich jest fakt, że miejsce docelowe przechowywania danych będzie musiało mieć wystarczająco dużo miejsca, aby zmieścić większy niefiltrowany zestaw danych. Zakładając, że menedżerowie danych mają wystarczającą ilość miejsca do przechowywania i że analizowanie danych w pamięci nie stwarza trudności technicznych, metoda deduplikacji po procesie może często być pożądanym sposobem na oczyszczenie zestawu danych do przyszłego wykorzystania po tym, jak został już dokładnie schowany "chłodnia."