CommencerCommencer gratuitement

Création de sous-ensemble de lignes

Une grande partie de la science des données consiste à trouver les éléments intéressants de votre ensemble de données. L'une des techniques les plus simples consiste à trouver un sous-ensemble de lignes correspondant à certains critères. Cette opération est parfois appelée filtrage des lignes ou sélection des lignes.

Il existe de nombreuses façons de subdiviser un DataFrame, la plus courante étant sans doute d'utiliser des opérateurs relationnels pour renvoyer True ou False pour chaque ligne, puis de passer le tout entre crochets.

dogs[dogs["height_cm"] > 60]
dogs[dogs["color"] == "tan"]

Vous pouvez filtrer sur plusieurs conditions à la fois en utilisant l'opérateur de manipulation de bit « bitwise » AND, &.

dogs[(dogs["height_cm"] > 60) & (dogs["color"] == "tan")]

homelessness est disponible et pandas est chargé en tant que pd.

Cet exercice fait partie du cours

Manipulation de données avec pandas

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Filter for rows where individuals is greater than 10000
ind_gt_10k = ____

# See the result
print(ind_gt_10k)
Modifier et exécuter le code