Ajout de nouvelles colonnes
Vous n'avez pas à vous contenter des données qui vous sont fournies. En revanche, vous pouvez ajouter de nouvelles colonnes à un DataFrame. Ce processus porte de nombreux noms, tels que transformation, mutation et ingénierie des fonctionnalités.
Vous pouvez créer de nouvelles colonnes à partir de zéro, mais il est également courant de les dériver d'autres colonnes, par exemple en les additionnant ou en modifiant leurs unités.
homelessness est un DataFrame contenant les estimations du nombre de sans-abri dans chacun des États américains en 2018. La colonne individual représente le nombre de personnes sans domicile ne faisant pas partie d'une famille avec enfants. La colonne family_members indique le nombre de personnes sans domicile faisant partie d'une famille avec enfants. La colonne state_pop représente la population totale de l'État.
homelessness est disponible et pandas est chargé en tant que pd.
Cet exercice fait partie du cours
Manipulation de données avec pandas
Instructions
- Ajoutez une nouvelle colonne à
homelessness, nomméetotal, contenant la somme des colonnesindividualsetfamily_members. - Ajoutez une autre colonne à
homelessness, nomméep_homeless, contenant la proportion dutotalde la population sans domicile par rapport à la population totale de chaque Étatstate_pop.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Add total col as sum of individuals and family_members
____
# Add p_homeless col as proportion of total homeless population to the state population
____
# See the result
print(homelessness)