Valeurs uniques d'une colonne
L'un des principaux atouts de Matplotlib réside dans sa capacité à s'automatiser pour s'adapter aux données qui lui sont fournies en entrée. Par exemple, si vous recevez des données comportant un nombre inconnu de catégories, vous pouvez tout de même créer un diagramme à barres comportant des barres pour chaque catégorie.
Dans cet exercice et le suivant, vous allez à nouveau visualiser le poids des athlètes participant aux Jeux olympiques d'été de 2016, à partir d'un ensemble de données contenant un nombre inconnu de disciplines sportives. Ces données seront chargées en mémoire sous la forme d'un objet pandas DataFrame appelé summer_2016_medals, qui comporte une colonne intitulée "Sport" indiquant à quelle discipline sportive correspond chaque ligne. Il existe également une rubrique intitulée "Weight" qui indique le poids de chaque athlète.
Dans cet exercice, nous allons extraire les valeurs uniques de la colonne "Sport"
Cet exercice fait partie du cours
Introduction à la visualisation de données avec Matplotlib
Instructions
- Créez une variable nommée
sports_columnqui contient les données de la colonne"Sport"de l'objetDataFrame. - Utilisez la méthode
uniquede cette variable pour identifier tous les sports uniques présents dans ces données, et attribuer ces valeurs à une nouvelle variable nomméesports. - Affichez la variable
sportssur la console.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Extract the "Sport" column
sports_column = ____
# Find the unique values of the "Sport" column
sports = ____
# Print out the unique sports values
____