Beim Begriff Data Warehouse handelt es sich um eine Plattform, die Daten aus verschiedenen Datenquellen sammelt, verdichtet, langfristig sichert und nachgelagerte Analysesysteme damit versorgt. Man bezeichnet das Data Warehouse auch als Datenlager. Vorteil dieses Datenlagers ist, dass eine globale Sicht auf Daten aus unterschiedlichen Datenbeständen entsteht. Gleichzeitig vereinfacht sich der Zugriff auf die Daten für Anwender, da sie in einer zentralen Datenbank konsistent und strukturiert bereitgestellt sind. Unternehmen können also große Mengen verschiedener Daten analysieren und daraus einen signifikanten Wert ziehen sowie Verlaufsdaten aufzeichnen.
Data Warehousing lässt sich in vier Teilprozesse aufteilen:
Unternehmen profitieren von Data Warehouses z.B. in folgenden Anwendungsbereichen:
Obwohl sie ähnliche Funktionen haben, unterscheiden sich Data Warehouses von Data Marts grundlegend. Ein Data Mart hat die gleichen Funktionen wie ein Data Warehouse, jedoch in einem sehr viel begrenzteren Geltungsbereich – in der Regel einer einzelnen Abteilung oder Branche. Aufgrunddessen sind Data Marts einfacher einzurichten, führen jedoch tendenziell zu Inkonsistenzen, da es schwierig sein kann, Daten über zahlreiche Data Marts hinweg einheitlich zu verwalten und zu kontrollieren.
Mehr Infos zu den Begriffen Data Mart und Data Lake, finden Sie im Ivalu Montagswiki.