Création de sous-ensemble de lignes
Une grande partie de la science des données consiste à trouver les éléments intéressants de votre ensemble de données. L'une des techniques les plus simples consiste à trouver un sous-ensemble de lignes correspondant à certains critères. Cette opération est parfois appelée filtrage des lignes ou sélection des lignes.
Il existe de nombreuses façons de subdiviser un DataFrame, la plus courante étant sans doute d'utiliser des opérateurs relationnels pour renvoyer True
ou False
pour chaque ligne, puis de passer le tout entre crochets.
dogs[dogs["height_cm"] > 60]
dogs[dogs["color"] == "tan"]
Vous pouvez filtrer sur plusieurs conditions à la fois en utilisant l'opérateur de manipulation de bit « bitwise » AND, &
.
dogs[(dogs["height_cm"] > 60) & (dogs["color"] == "tan")]
homelessness
est disponible et pandas
est chargé en tant que pd
.
Cet exercice fait partie du cours
Manipulation de données avec pandas
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Filter for rows where individuals is greater than 10000
ind_gt_10k = ____
# See the result
print(ind_gt_10k)