Nieuwe kolommen toevoegen
Je zit niet vast aan alleen de data die je krijgt. Je kunt namelijk nieuwe kolommen toevoegen aan een DataFrame. Dat heet ook wel transformeren, muteren of feature engineering.
Je kunt nieuwe kolommen helemaal zelf maken, maar vaak leid je ze af van andere kolommen, bijvoorbeeld door kolommen bij elkaar op te tellen of hun eenheden om te zetten.
homelessness is een DataFrame met schattingen van dakloosheid in elke Amerikaanse staat in 2018. De kolom individual is het aantal daklozen dat geen deel uitmaakt van een gezin met kinderen. De kolom family_members is het aantal daklozen dat wél deel uitmaakt van een gezin met kinderen. De kolom state_pop is de totale bevolking van de staat.
homelessness is beschikbaar en pandas is geladen als pd.
Deze oefening maakt deel uit van de cursus
Datamanipulatie met pandas
Oefeninstructies
- Voeg een nieuwe kolom toe aan
homelessness, met de naamtotal, met de som van de kolommenindividualsenfamily_members. - Voeg nog een kolom toe aan
homelessness, met de naamp_homeless, met het aandeel van detotaldakloze bevolking ten opzichte van de totale bevolking in elke staatstate_pop.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Add total col as sum of individuals and family_members
____
# Add p_homeless col as proportion of total homeless population to the state population
____
# See the result
print(homelessness)