Distribution des colonnes et doublons
Nous pouvons utiliser la fonction distribution des colonnes pour vérifier le nombre de valeurs uniques et le nombre de catégories distinctes dans nos colonnes. Cela peut nous donner une bonne indication des colonnes qui contiennent des valeurs en double et de celles qui pourraient avoir le mauvais nombre de catégories.
Vous trouverez plus d'informations sur la gestion des doublons dans cet article de MSFT Learn.
Notre directeur nous a demandé de vérifier la colonne Color dans notre ensemble de données, car elle semble comporter une erreur suite à une mauvaise saisie de certaines données. Il est sûr que nous ne stockons que 10 couleurs différentes de produits (y compris les produits qui n'ont pas de couleur). Utilisez les fonctionnalités de Power Query pour vérifier et corriger le jeu de données.
Si vous avez perdu votre progression, commencez par charger le classeur 2_1_column_distribution.pbix à partir du dossier « Exercices » sur le Bureau et ouvrez l'éditeur Power Query.
Cet exercice fait partie du cours
Préparation des données dans Power BI
Exercice interactif pratique
Passez de la théorie à la pratique avec l’un de nos exercices interactifs
Commencer l’exercice