Ajout de nouvelles colonnes
Vous n'avez pas à vous contenter des données qui vous sont fournies. En revanche, vous pouvez ajouter de nouvelles colonnes à un DataFrame. Ce processus porte de nombreux noms, tels que transformation, mutation et ingénierie des fonctionnalités.
Vous pouvez créer de nouvelles colonnes à partir de zéro, mais il est également courant de les dériver d'autres colonnes, par exemple en les additionnant ou en modifiant leurs unités.
homelessness
est un DataFrame contenant les estimations du nombre de sans-abri dans chacun des États américains en 2018. La colonne individual
représente le nombre de personnes sans domicile ne faisant pas partie d'une famille avec enfants. La colonne family_members
indique le nombre de personnes sans domicile faisant partie d'une famille avec enfants. La colonne state_pop
représente la population totale de l'État.
homelessness
est disponible et pandas
est chargé en tant que pd
.
Cet exercice fait partie du cours
Manipulation de données avec pandas
Instructions
- Ajoutez une nouvelle colonne à
homelessness
, nomméetotal
, contenant la somme des colonnesindividuals
etfamily_members
. - Ajoutez une autre colonne à
homelessness
, nomméep_homeless
, contenant la proportion dutotal
de la population sans domicile par rapport à la population totale de chaque Étatstate_pop
.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Add total col as sum of individuals and family_members
____
# Add p_homeless col as proportion of total homeless population to the state population
____
# See the result
print(homelessness)