Spisu treści:
Definicja - Co oznacza Data Mining?
Eksploracja danych to proces analizowania ukrytych wzorców danych zgodnie z różnymi perspektywami kategoryzacji w użyteczne informacje, które są gromadzone i gromadzone we wspólnych obszarach, takich jak hurtownie danych, w celu wydajnej analizy, algorytmów eksploracji danych, ułatwiania podejmowania decyzji biznesowych i innych informacji wymagania, aby ostatecznie obniżyć koszty i zwiększyć przychody.
Eksploracja danych jest również znana jako odkrywanie danych i odkrywanie wiedzy.
Techopedia wyjaśnia Data Mining
Główne etapy procesu eksploracji danych to:
- Wyodrębnij, przekształć i załaduj dane do hurtowni danych
- Przechowuj dane i zarządzaj nimi w wielowymiarowych bazach danych
- Zapewnij dostęp do danych analitykom biznesowym za pomocą oprogramowania aplikacyjnego
- Prezentuj analizowane dane w łatwo zrozumiałych formach, takich jak wykresy
Pierwszym krokiem w eksploracji danych jest zebranie odpowiednich danych o kluczowym znaczeniu dla biznesu. Dane firmy są transakcyjne, nieoperacyjne lub metadane. Dane transakcyjne dotyczą codziennych operacji, takich jak sprzedaż, zapasy i koszty itp. Dane nieoperacyjne są zwykle prognozowane, podczas gdy metadane dotyczą logicznego projektowania baz danych. Wzorce i relacje między elementami danych wyświetlają istotne informacje, które mogą zwiększać przychody organizacji. Organizacje silnie zorientowane na konsumenta zajmują się technikami eksploracji danych, zapewniając wyraźne zdjęcia sprzedanych produktów, ceny, konkurencji i danych demograficznych klientów.
Na przykład gigant handlu detalicznego Wal-Mart przesyła wszystkie istotne informacje do hurtowni danych z terabajtami danych. Dostawcy mogą łatwo uzyskać dostęp do tych danych, umożliwiając im identyfikację wzorców zakupowych klientów. Mogą generować wzorce nawyków zakupowych, najczęściej kupowanych dni, najbardziej poszukiwanych produktów i innych danych wykorzystujących techniki eksploracji danych.
Drugim krokiem w eksploracji danych jest wybranie odpowiedniego algorytmu - mechanizmu tworzącego model eksploracji danych. Ogólne działanie algorytmu polega na identyfikowaniu trendów w zbiorze danych i wykorzystaniu danych wyjściowych do definicji parametrów. Najpopularniejszymi algorytmami wykorzystywanymi do eksploracji danych są algorytmy klasyfikacji i algorytmy regresji, które są używane do identyfikacji zależności między elementami danych. Główni dostawcy baz danych, tacy jak Oracle i SQL, wykorzystują algorytmy eksploracji danych, takie jak klastrowanie i regresja w celu zaspokojenia popytu na eksplorację danych.




