CommencerCommencer gratuitement

Ajout de nouvelles colonnes

Vous n'avez pas à vous contenter des données qui vous sont fournies. En revanche, vous pouvez ajouter de nouvelles colonnes à un DataFrame. Ce processus porte de nombreux noms, tels que transformation, mutation et ingénierie des fonctionnalités.

Vous pouvez créer de nouvelles colonnes à partir de zéro, mais il est également courant de les dériver d'autres colonnes, par exemple en les additionnant ou en modifiant leurs unités.

homelessness est un DataFrame contenant les estimations du nombre de sans-abri dans chacun des États américains en 2018. La colonne individual représente le nombre de personnes sans domicile ne faisant pas partie d'une famille avec enfants. La colonne family_members indique le nombre de personnes sans domicile faisant partie d'une famille avec enfants. La colonne state_pop représente la population totale de l'État.

homelessness est disponible et pandas est chargé en tant que pd.

Cet exercice fait partie du cours

Manipulation de données avec pandas

Afficher le cours

Instructions

  • Ajoutez une nouvelle colonne à homelessness, nommée total, contenant la somme des colonnes individuals et family_members.
  • Ajoutez une autre colonne à homelessness, nommée p_homeless, contenant la proportion du total de la population sans domicile par rapport à la population totale de chaque État state_pop.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Add total col as sum of individuals and family_members
____

# Add p_homeless col as proportion of total homeless population to the state population
____

# See the result
print(homelessness)
Modifier et exécuter le code