In de computerwereld is een datawarehouse een centrale opslagplaats van geïntegreerde gegevens uit een of meer ongelijksoortige bronnen. Het is ontworpen voor analytische verwerking en ondersteunt business intelligence (BI)-activiteiten zoals rapportage, analyse en datamining. In tegenstelling tot een typische operationele database (zoals die wordt gebruikt voor transactieverwerking), richt een datawarehouse zich op het leveren van historische gegevens voor strategische besluitvorming in plaats van op het ondersteunen van de dagelijkse bedrijfsvoering.
Belangrijkste kenmerken van een datawarehouse:
* Onderwerpgericht: Gegevens zijn georganiseerd rond specifieke zakelijke onderwerpen (bijvoorbeeld klanten, producten, verkoop) in plaats van operationele processen.
* Geïntegreerd: Gegevens uit verschillende bronnen worden geconsolideerd en gestandaardiseerd om consistentie te garanderen. Vaak gaat het hierbij om het oplossen van inconsistenties in dataformaten en naamgevingsconventies.
* Tijdvariant: Gegevens worden historisch opgeslagen, waardoor trends in de loop van de tijd kunnen worden geanalyseerd. Dit omvat het vastleggen van gegevens op verschillende tijdstippen.
* Niet-vluchtig: Gegevens in een datawarehouse zijn doorgaans alleen-lezen. Updates worden uitgevoerd via ETL-processen (Extract, Transform, Load) in plaats van directe wijzigingen.
In wezen biedt een datawarehouse één consistent beeld van bedrijfsgegevens, waardoor het voor analisten en besluitvormers gemakkelijker wordt om trends, patronen en prestaties te begrijpen. Dit staat in contrast met operationele databases die zijn geoptimaliseerd voor snelheid en efficiëntie van transacties. |