Hurtownia danych

Z DisWiki
Przejdź do nawigacji Przejdź do wyszukiwania

hurtownia danych (data warehouse, data mart) - scentralizowane repozytorium informacji dotyczących określonego tematu lub dziedziny, gromadzonych z różnych, być może odległych, źródeł (np. dotyczących rynku metali kolorowych, usług transportowych, eksportu towarów itd.). Hurtownie danych służą do przeprowadzania analiz, wyszukiwań i przeglądów mających na celu podejmowanie decyzji. Ważnymi cechami hurtowni danych są:

  • uporządkowanie tematyczne różnych obszarów analitycznych,
  • integracja danych z różnych systemów baz danych,
  • trwałość zapisanych i przechowywanych danych,
  • uwzględnienie wymiaru czasowego przechowywanych informacji.

Analizy oparte na hurtowniach danych mogą być przeprowadzane za pomocą środków manualnych, półautomatycznych lub automatycznych (np. metod statystycznych); te ostatnie wymagają zwykle zamiany formatu informacji przechowywanych w rozproszonych miejscach (często bardzo nieregularnego) na format wygodny dla określonej grupy metod i algorytmów przetwarzania. Hurtownie danych są także nazywane magazynami danych. Są one często kojarzone z terminami OLAP, eksploracją danych (data mining) oraz kostką danych (data cube), czyli specjalnym, bardzo regularnym formatem danych przystosowanym do tworzenia szybkich analiz, przeglądów i zestawień. Tworzenie hurtowni danych jest z natury połączone z procesem czyszczenia, porządkowania i ułożenia w przystępnym formacie danych operacyjnych firmy.


Zobacz także: