Conseils et formations : vos deux atouts pour réussir !
Accueil > Integration Services > Articles
Profilage de données avec SSIS 2008

 

De quoi s'agit-il ?

D'une nouvelle tâche du flux de contrôle :

 

Son objectif est d'analyser de manière statistique les données d'une table.

Un certain nombre de profils d'analyse sont disponibles :

 

Je vais décrire ici certains de ces profils.

 

Profil de distribution de longueur de colonnes :

L'objectif est ici de connaitre la répartition des données d'une colonne en terme de longueur.

 

Configurons les données à analyser :

Et la cible :

On note ici qu'il s'agit d'un fichier.

Une fois l'analyse terminée :

Le fichier produit est au format XML :

 

Surprenant, j'ai quand même 2590 coureurs dont le nom comporte 3 lettres : sans doute des YAN et autres noms d'origine asiatique.

 

Heureusement, un programme a été développé pour lire ce format XML :

"C:\Program Files\Microsoft SQL Server\100\DTS\Binn\DataProfileViewer.exe"

 

Profil de clé candidate :

Une colonne peut elle être une clé candidate ?

Mon 1er run avec cette 2ème demande ne donne rien ?

Sans doute du à un des paramétres de la tâche :

Effectivement, la 'puissance' de la clé est par défaut de 95%, et celle vérifiée ici ne donne que 74% :

 

A noter que la 'puissance' s'appelle la plus part du temps densité ou seléctivité dans les autres parties du logiciel…

 

Profil de ratio null de colonne :

 

 

 

Conclusion :

Un petit outil bien sympathique avant de se lancer dans des transferts ou migrations de données…

Ets-il besoin de rappeller que le choix des clés primaires et étrangères est fondamental !

 ‭(Masqué)‬ WebPart1 Web Part

/SSIS/Profilage de données avec SSIS 2008/