L’ETL est un outil qui permet de construire le datawarehouse en agissant directement sur les données.
Généralement les bases de données client ne sont pas optimisées. Les données sont à différents formats, il y a plusieurs patterns utilisés, ou il y a des données incomplètes….
L’ETL va donc aider à clarifier tout ça en partant de diverses sources… En effet il repose sur des connecteurs :
- applicatifs : SAP, people soft….
- BDD : Oracle, DB2….
- Fichiers : XML, plat, cvs….
- Fichiers non structurés : Excel, pdf…
Dans les ETL les plus connus nous avons :
- Powercenter d’Informatica
- datastage d’IBM
Voici une petite image pour illustrer :