Supprimer les données manquantes
Dans cet exercice, vous allez supprimer certaines lignes où des colonnes contiennent des valeurs manquantes. Vous allez examiner les colonnes length_of_time, state et type. Vous supprimerez toute ligne qui contient au moins une valeur manquante dans l’une de ces trois colonnes.
Cet exercice fait partie du cours
<cours>Prétraitement pour le Machine Learning en Python</cours>Instructions de l’exercice
- Affichez le nombre de valeurs manquantes dans les colonnes
length_of_time,stateettype, dans cet ordre, en utilisant.isna()et.sum(). - Supprimez les lignes qui ont des valeurs manquantes dans au moins une de ces colonnes.
- Affichez la
shapedu nouveau jeu de donnéesufo_no_missing.
Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
# Count the missing values in the length_of_time, state, and type columns, in that order
print(ufo[[____, ____, ____]].____.____)
# Drop rows where length_of_time, state, or type are missing
ufo_no_missing = ____
# Print out the shape of the new dataset
print(____)