Dom Bazy danych Dlaczego menedżerowie powinni unikać redundancji bazy danych?

Dlaczego menedżerowie powinni unikać redundancji bazy danych?

Anonim

P:

Dlaczego menedżerowie powinni unikać redundancji bazy danych?

ZA:

Menedżerowie baz danych i inni specjaliści IT powinni chronić się przed „nadmiarowością bazy danych” lub „nadmiarowością danych” ze względu na wszystkie negatywne skutki, jakie nadmiarowość może mieć w systemie lub środowisku bazy danych. Ilekroć określony fragment danych jest duplikowany, w dwóch polach w bazie danych lub w dwóch różnych środowiskach bazy danych, może to mieć konsekwencje dla pobierania danych.

Jednym z pierwszych powodów unikania nadmiarowości danych jest to, że może to być marnotrawstwo lub nadmierne.

Należy zauważyć, że planowane są niektóre rodzaje nadmiarowości danych w celu ochrony i tworzenia kopii zapasowych danych. Jednak inne wynikają z niewłaściwego lub nieefektywnego kodowania lub braku przywiązania do najlepszych praktyk. W wielu przypadkach duża ilość nadmiarowości danych powoduje, że baza danych szybko rośnie powyżej rozsądnego rozmiaru. Mając to na uwadze, podejmowane są liczne wysiłki w celu zwalczania nadmiarowości danych w celu zaoszczędzenia miejsca w bazie danych, a co za tym idzie, w celu zmniejszenia kosztów i prac konserwacyjnych. Należy to jednak zrobić z myślą o praktyczności - inżynierowie mogą ćwiczyć coś, co nazywa się deduplikacją danych, ale należy to zrobić w sposób efektywny.

Na przykład menedżerowie baz danych mogą zbadać coś takiego jak zabranie ciągu z powtarzającego się pola, takiego jak wspólny klient lub nazwa firmy, i zastąpienie go prostym odwołaniem do zmiennej, gdzie ciąg jest przechowywany gdzie indziej. Może to zaoszczędzić miejsce w bazie danych - ale może również wymagać większej aktywności serwera do wykonania danego zapytania, więc może nie być tak wydajne, jak się wydaje.

Innym ważnym powodem deduplikacji danych lub uniknięcia nadmiarowości danych jest zamieszanie, które może wyniknąć. Nadmiarowe dane w bazie danych mogą powodować różnego rodzaju anomalie. Jedna z nich nazywa się anomalią aktualizacji - anomalie aktualizacji występują, gdy rekord jest ponownie wprowadzany ze zaktualizowanymi informacjami, ale aktualizacja nie przywraca oryginalnego rekordu. W takiej sytuacji mogą istnieć trzy różne rekordy dla konkretnego pracownika firmy, z trzema różnymi tytułami pracy i trzema różnymi adresami, ponieważ informacje o tej osobie nie były aktualizowane w całej bazie danych, ale tylko w ostatnio wprowadzonym rekordzie.

Jak sugerują eksperci, administratorzy baz danych mogą uniknąć nadmiarowości danych od samego początku. Mogą również angażować się w praktyki normalizacji danych, które mogą naprawić anomalie aktualizacji i inne rodzaje anomalii poprzez standaryzację sposobów przechowywania rekordów tabel bazy danych. Administratorzy baz danych mogą również podejmować wysiłki w zakresie deduplikacji danych, które oczyszczają i standaryzują dane na inne sposoby. Wszystko to służy stworzeniu czystszych tabel bazy danych, ujednoliceniu zapisów bazy danych i zapobieganiu wszelkim problemom głowy i złożonym problemom związanym z nieplanowaną nadmiarowością danych.

Dlaczego menedżerowie powinni unikać redundancji bazy danych?