Attaque combinée !
Vous avez vu les quatre types de manipulation de données les plus courants : le tri des lignes, la subdivision des colonnes, la subdivision des lignes et l'ajout de nouvelles colonnes. Dans une analyse de données réelle, vous pouvez combiner ces quatre manipulations pour répondre à une multitude de questions.
Dans cet exercice, vous répondrez à la question suivante : « Quel est l'État qui compte le plus grand nombre de sans-abri pour 10 000 habitants ? ». Combinez vos nouvelles compétences pandas
pour le découvrir.
Cet exercice fait partie du cours
Manipulation de données avec pandas
Instructions
- Ajoutez une colonne
indiv_per_10k
àhomelessness
, contenant le nombre de sans-abri pour dix mille personnes dans chaque État, en utilisantstate_pop
pour la population de l'État. - Créez un sous-ensemble de lignes où
indiv_per_10k
est plus élevé que20
, affecté àhigh_homelessness
. - Triez
high_homelessness
par ordre décroissant deindiv_per_10k
, en l'affectant àhigh_homelessness_srt
. - Sélectionnez uniquement les colonnes
state
etindiv_per_10k
dehigh_homelessness_srt
et enregistrez sousresult
. Regardez le résultatresult
.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create indiv_per_10k col as homeless individuals per 10k state pop
homelessness["indiv_per_10k"] = 10000 * ____ / ____
# Subset rows for indiv_per_10k greater than 20
high_homelessness = ____
# Sort high_homelessness by descending indiv_per_10k
high_homelessness_srt = ____
# From high_homelessness_srt, select the state and indiv_per_10k cols
result = ____
# See the result
print(result)