P:
Co oznacza duże zbiory danych dla oficjalnych statystyk?
ZA:Pytanie, w jaki sposób duże dane mogą zmienić oficjalne statystyki oraz badania agencji federalnych lub rządowych, jest fascynujące, częściowo ze względu na naturę nowoczesnych systemów eksploracji i gromadzenia danych.
W pewnym sensie duże zbiory danych konkurują z innymi tradycyjnymi metodami gromadzenia informacji. Na przykład szeroko zagregowane dane z Internetu mogą być dokładniejszym predyktorem niż dane wytwarzane przez „społeczność ekspertów” w danej branży. Oznacza to, że duże zbiory danych mogą popchnąć różne rodzaje oficjalnych statystyk w kierunku dokładniejszych prognoz lub bardziej wydajnej metodologii.
Innym sposobem, w jaki dane mogą zmienić oficjalne statystyki, jest to, że przyszłe metody badawcze mogą integrować rozwiązania dużych zbiorów danych w celu skorzystania z tego elementu wysiłku badawczego. Na przykład, US Census Bureau przeprowadza wiele fizycznych kontroli ludzi, budynków i infrastruktury w USA, opierając swoje statystyki na obserwacjach i odpowiedziach w czasie rzeczywistym. Włączenie dużych zbiorów danych do wysiłków Biura Spisu Powszechnego USA może oznaczać agregowanie danych internetowych o tych samych systemach i porównywanie ich z tym, co pracownicy dowiadują się w terenie. Istnieje wiele sposobów integracji dużych zbiorów danych i badań terenowych, które określą konkretne wyniki każdego rodzaju projektu badawczego o charakterze gospodarczym, społecznym lub branżowym.
Krótko mówiąc, duże dane zmienią oficjalne statystyki w bardziej nowoczesną i wyrafinowaną formę raportowania, w której staranne fizyczne zestawianie tabel jest wzmocnione przez techniczne modele i algorytmy, które działają na podstawie uśredniania lub projekcji z ogromnych ilości wydobytych lub zebranych danych. To tylko jeden powód, dla którego ogromne ilości dużych zbiorów danych gromadzonych przez rządy i firmy są tak cenne i starannie chronione.