Dom Audio Co to są nieustrukturyzowane dane? - definicja z techopedii

Co to są nieustrukturyzowane dane? - definicja z techopedii

Spisu treści:

Anonim

Definicja - Co oznaczają dane nieustrukturyzowane?

Dane nieustrukturyzowane reprezentują wszelkie dane, które nie mają rozpoznawalnej struktury. Jest niezorganizowany i surowy i może być nietekstowy lub tekstowy. Na przykład e-mail jest dobrą ilustracją nieustrukturyzowanych danych tekstowych. Zawiera godzinę, datę, dane odbiorcy i nadawcy, temat itp., Ale treść wiadomości e-mail pozostaje niezorganizowana. Dane nieustrukturyzowane można również zidentyfikować jako dane o luźnej strukturze, przy czym źródła danych zawierają strukturę, ale nie wszystkie dane w zestawie danych mają tę samą strukturę.

W firmach skoncentrowanych na kliencie dane znalezione w nieustrukturyzowanej formie mogą zostać zbadane w celu usprawnienia marketingu relacji i zarządzania relacjami z klientem (CRM). Ponieważ aplikacje społecznościowe, takie jak Facebook i Twitter, stają się głównym nurtem, niestrukturalne opracowywanie danych prawdopodobnie wyprzedzi postęp ustrukturyzowanych danych.

Techopedia wyjaśnia dane nieustrukturyzowane

Dane nieustrukturyzowane odnoszą się do danych, które mają formę mniej uporządkowaną niż pozycje, takie jak strony arkuszy kalkulacyjnych, tabele bazy danych lub inne liniowe lub uporządkowane zestawy danych. W rzeczywistości termin „zestaw danych” jest pomocny, ponieważ jest powiązany z danymi, które znajdują się w czystych, dostępnych tablicach, bez dodatkowej zawartości i które są połączone lub oznaczone w określonej strukturze.

Inne przypadki nieustrukturyzowanych danych tekstowych obejmują dokumenty Word, prezentacje PowerPoint, wiadomości błyskawiczne, oprogramowanie do współpracy, dokumenty, książki, posty w mediach społecznościowych i dokumentację medyczną. Nietekstowe nieustrukturyzowane dane są generalnie tworzone w mediach, takich jak pliki audio MP3, obrazy JPEG i pliki wideo Flash itp.

Dane nieustrukturyzowane zwykle nie zawierają predefiniowanego modelu danych i mogą nie pasować dobrze do tabel relacyjnych. Nieustrukturyzowane dane zwykle zawierają dużo tekstu. Może jednak zawierać liczby i daty, a także fakty. Prowadzi to do dwuznaczności, które są trudne do zidentyfikowania za pomocą konwencjonalnych programów.

Przechowywanie ogromnych ilości nieustrukturyzowanych danych generowanych w przedsiębiorstwie, jeśli źle zarządzane, może prowadzić do wyższych wydatków. Dane w papierowych dokumentach lub w formacie elektronicznym muszą zostać zeskanowane, aby aplikacja wyszukująca mogła przeanalizować pomysły w zależności od słów użytych w określonych kontekstach. Jest to znane jako wyszukiwanie korporacyjne lub semantyczne.

Co to są nieustrukturyzowane dane? - definicja z techopedii