Neue Spalten hinzufügen
Du musst dich nicht mit den Daten begnügen, die du vorgelegt bekommst, sondern kannst auch neue Spalten zu einem DataFrame hinzufügen. Dies wird als Transformieren, Mutieren oder Feature Engineering bezeichnet.
Du kannst weitere Spalten von Grund auf neu erstellen oder sie einfach von anderen Spalten ableiten, zum Beispiel indem du Spalten zusammenfügst oder ihre Einheiten änderst.
homelessness
ist ein DataFrame mit Datenschätzungen zur Obdachlosigkeit in jedem US-Bundesstaat im Jahr 2018. Die Spalte individual
gibt die Anzahl der Obdachlosen an, die nicht zu einer Familie mit Kindern gehören. Die Spalte family_members
gibt die Anzahl der Obdachlosen an, die zu einer Familie mit Kindern gehören. Die Spalte state_pop
gibt die Gesamtbevölkerung des Bundesstaates an.
homelessness
ist bereits verfügbar und pandas
wurde als pd
geladen.
Diese Übung ist Teil des Kurses
Datenbearbeitung mit pandas
Anleitung zur Übung
- Füge zu
homelessness
eine neue Spalte namenstotal
hinzu, die die Summe der Spaltenindividuals
undfamily_members
enthält. - Füge zu
homelessness
eine weitere Spalte namensp_homeless
hinzu, die den Anteil der obdachlosen Bevölkerung insgesamt (total
) an der Gesamtbevölkerung (state_pop
) in jedem Bundesstaat enthält.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Add total col as sum of individuals and family_members
____
# Add p_homeless col as proportion of total homeless population to the state population
____
# See the result
print(homelessness)