Dom Bezpieczeństwo Co to jest zaburzenie danych? - definicja z techopedii

Co to jest zaburzenie danych? - definicja z techopedii

Spisu treści:

Anonim

Definicja - Co oznacza „Perturbacja danych”?

Zakłócenie danych to forma eksploracji danych w celu zachowania prywatności dla elektronicznej dokumentacji medycznej (EHR). Istnieją dwa główne typy zakłóceń danych odpowiednie dla ochrony danych EHR. Pierwszy typ jest znany jako metoda rozkładu prawdopodobieństwa, a drugi typ nazywa się metodą zniekształcenia wartości. Wiązanie danych jest uważane za stosunkowo łatwą i skuteczną technikę ochrony wrażliwych danych elektronicznych przed nieuprawnionym użyciem.

Techopedia wyjaśnia Perturbację danych

Okaleczanie danych zostało okrzyknięte bardziej skutecznym zastosowaniem ochrony danych w służbie zdrowia niż deententyfikacja / ponowna identyfikacja ze względu na większe prawdopodobieństwo wystąpienia ataków, które łączą publiczne zbiory danych z oryginalnymi identyfikatorami lub podmiotami. Z tego właśnie powodu okaleczanie danych jest uważane za bardziej solidną aplikację, jeśli chodzi o bezpieczeństwo EHR.


Metoda rozkładu prawdopodobieństwa pobiera dane i zastępuje je z tej samej próbki rozkładu lub z samej dystrybucji. Podejście zniekształcające wartości zaburza dane przez hałas multiplikatywny lub addytywny lub inne randomizowane procesy. Uważa się go za bardziej skuteczny niż poprzedni rodzaj zaburzeń. To podejście buduje klasyfikatory drzewa decyzyjnego, w których każdemu elementowi przypisany jest na przykład szum losowy z rozkładu Gaussa. Dzięki eksploracji danych pierwotna dystrybucja danych jest odbudowywana z zaburzonej wersji. Jednak krytycy zwracają uwagę na fakt, że losowy hałas addytywny może być filtrowany, co może prowadzić do naruszenia prywatności EHR.

Co to jest zaburzenie danych? - definicja z techopedii