Powered By Blogger

20 novembre 2008

Funzione dell'ETL e i principali tool software di ETL

Extract, Transform, Load (ETL) sono le 3 fasi di estrazione, trasformazione e caricamento dei dati in un sistema di sintesi (DW, DM, ecc).

1- Estrazione (Extract) dei dati da sistemi sorgenti quali database transazionali, comuni file di testo o da altri sistemi informatici.

2- Trasformazione (Transform) con lo scopo di consolidare i dati (cioè rendere omogenei dati provenienti da sorgenti diverse) e di fare in modo che siano più aderenti alla logica di business del sistema di analisi per cui viene sviluppato.
Questa fase consiste, ad esempio, nel:
- Selezionare solo quelli che sono di interesse per il sistema
- Normalizzare i dati (per esempio eliminando i duplicati)
- Tradurre dati codificati
- Derivare nuovi dati calcolati
- Eseguire accoppiamenti (join) tra dati recuperati da differenti tabelle
- Raggruppare i dati

3- Memorizzazione (Load) dei dati nelle tabelle del sistema di sintesi.

I principali software ETL sono:
- SmartDB Workbench
- DataStudio
- Integrator
- Informatica PowerCenter
- Datastage IBM
- SSIS Microsoft
- I-service IngeniumTechnology
- Scriptella ETL
- Benetl
- Oracle Data Integration Suite
- Kettle Pentaho Data Integration