Aan de slagGa gratis aan de slag

Nieuwe kolommen toevoegen

Je zit niet vast aan alleen de data die je krijgt. Je kunt namelijk nieuwe kolommen toevoegen aan een DataFrame. Dat heet ook wel transformeren, muteren of feature engineering.

Je kunt nieuwe kolommen helemaal zelf maken, maar vaak leid je ze af van andere kolommen, bijvoorbeeld door kolommen bij elkaar op te tellen of hun eenheden om te zetten.

homelessness is een DataFrame met schattingen van dakloosheid in elke Amerikaanse staat in 2018. De kolom individual is het aantal daklozen dat geen deel uitmaakt van een gezin met kinderen. De kolom family_members is het aantal daklozen dat wél deel uitmaakt van een gezin met kinderen. De kolom state_pop is de totale bevolking van de staat.

homelessness is beschikbaar en pandas is geladen als pd.

Deze oefening maakt deel uit van de cursus

Datamanipulatie met pandas

Cursus bekijken

Oefeninstructies

  • Voeg een nieuwe kolom toe aan homelessness, met de naam total, met de som van de kolommen individuals en family_members.
  • Voeg nog een kolom toe aan homelessness, met de naam p_homeless, met het aandeel van de total dakloze bevolking ten opzichte van de totale bevolking in elke staat state_pop.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Add total col as sum of individuals and family_members
____

# Add p_homeless col as proportion of total homeless population to the state population
____

# See the result
print(homelessness)
Code bewerken en uitvoeren