Dom Bezpieczeństwo Co to jest filtr bayesowski? - definicja z techopedii

Co to jest filtr bayesowski? - definicja z techopedii

Spisu treści:

Anonim

Definicja - Co oznacza filtr Bayesian?

Filtr bayesowski to program komputerowy wykorzystujący logikę bayesowską lub analizę bayesowską, które są synonimami. Służy do oceny nagłówka i treści wiadomości e-mail oraz ustalenia, czy stanowi spam - niechcianą wiadomość e-mail lub elektroniczny odpowiednik masowej lub niepotrzebnej poczty elektronicznej w formie papierowej). Filtr Bayesian najlepiej jest stosować wraz z programami antywirusowymi.

Techopedia wyjaśnia filtr bayesowski

Filtr Bayesian działa z prawdopodobieństwem wystąpienia określonych słów w nagłówku lub treści wiadomości e-mail. Niektóre słowa wskazują na duże prawdopodobieństwo, że wiadomość e-mail jest spamem, takie jak Viagra i refinansowanie. Filtr nie zaczyna się od rozpoznania prawdopodobieństwa, że ​​słowo wskazuje na wysokie prawdopodobieństwo spamu. Użytkownicy muszą ręcznie zidentyfikować wiadomość e-mail jako spam. Gdy zostanie znaleziona wystarczająca liczba wystąpień tego słowa, a wiadomość e-mail zostanie zidentyfikowana jako spam, filtr bayesowski „uczy się” rozpoznawania słowa za pomocą funkcji prawdopodobieństwa. To samo dzieje się z wieloma innymi słowami i wyrażeniami. Z czasem filtr bayesowski staje się coraz bardziej skuteczny w identyfikowaniu spamu dla konkretnego użytkownika. Gdy prawdopodobieństwo osiągnie określony próg, na przykład 95 procent, wiadomość e-mail jest identyfikowana jako spam i często jest przenoszona do folderu śmieci (a czasem nawet automatycznie usuwana). Użytkownik może go okresowo przeglądać i decydować, czy go usunąć. Alternatywnie niektóre programy spamowe przenoszą go do miejsca kwarantanny, w którym użytkownicy mogą przeglądać wiadomości e-mail i przeglądać decyzję oprogramowania.

Wstępne „szkolenie” często można udoskonalić, aby zmniejszyć liczbę fałszywych trafień lub fałszywych negatywów w przypadku znalezienia złych osądów. Pozwala to filtrowi bayesowskiemu oprogramowania dostosować się do stale ewoluującego charakteru spamu.

Niektóre filtry antyspamowe wykorzystują również heurystykę wraz z filtrem bayesowskim. Wstępnie zdefiniowane reguły są konfigurowane przez użytkownika w celu dalszego zwiększenia dokładności identyfikacji wiadomości e-mail jako spam. Reguły te mogą obejmować liczbę wystąpień danego słowa, eliminować lub ignorować neutralne słowa, takie jak „the”, „a” lub „some”, lub identyfikować sekwencje dzieł takich jak „Viagra jest dobra”, a nie stosować prawdopodobieństwa funkcja dla wszystkich czterech pojedynczych słów.

Spamerzy mogą stosować technikę zwaną zatruciem bayesowskim, aby obniżyć skuteczność filtrów spamowych za pomocą filtrowania bayesowskiego. Niektóre techniki obejmują wstrzykiwanie legalnego tekstu ze źródeł informacyjnych lub literackich, używanie przypadkowych, nieszkodliwych słów, które rzadko występują w spamie, a nawet zamiana tekstu na obrazy.

Wiele klientów poczty e-mail wyłącza wyświetlanie zdjęć ze względów bezpieczeństwa. W ten sposób spam może dotrzeć do mniejszej liczby odbiorców.

Filtr bayesowski wykorzystujący logikę bayesowską może służyć do klasyfikowania dowolnego rodzaju danych. Medycyna, nauka i inżynieria znalazły zastosowanie. Co ciekawe, naukowcy spekulują, że nawet ludzki mózg może korzystać z metodologii logiki bayesowskiej do klasyfikowania bodźców i określania konkretnych zachowań reakcyjnych.

Co to jest filtr bayesowski? - definicja z techopedii