BI experience

C’est quoi un datawarehouse?

| 0 Commentaires

Dans le datawarehouse les données sont :

  • intégrées, c’est-à-dire qu’elles sont complètes et directement exploitables (et non sous la forme de code ou de liens à résoudre avant exploitation), on utilise pour cela un ETL.
  • non volatiles, elles ne peuvent pas être supprimées après exploitation.
  • historisées,c’est-à-dire que les données sont positionnées dans le temps, pour suivre leur évolution.
    _______________________________________________________

Les informations peuvent être nettoyées. En effet un datawarehouse devrait avoir des données de qualités pour être optimisées au maximum.
Les données peuvent être consolidées. c’est à dire regroupées de façon cohérente. Cette consolidation concerne généralement des données organisées logiquement ou liées entre elles. Ce regroupement a pour but de répondre aux différents besoins métiers en choisissant correctement la granularité de l’information à montrer, les bonnes dimensions avec les bons attributs et les bonnes hiérarchies.

Cette concentration de données hétérogènes, provenant de diverses sources amonts, est centralisée dans le système décisionnel et, constitue notre entrepôt de données (ou datawarehouse) auquel on peut y adosser un ou plusieurs magasins de données (ou datamarts) spécialisés le plus souvent par processus ou fonction de l’entreprise.

C’est ainsi que les datamarts et que le datawarehouse sont bien ciblés et donc l’information contenue répond aux besoins attendus.

Dans les deux cas, il s’agit souvent d’une base de données relationnelle qui doit accueillir et manipuler une volumétrie importante de données. Ce peut être une

  • base de données commerciale (Oracle, DB2, SQL Server, …)
  • base de données open source (MySql, PostgreSql, …)

Laisser un commentaire

Champs Requis *.

*