Neue Spalten hinzufügen
Du musst dich nicht mit den Daten begnügen, die du vorgelegt bekommst, sondern kannst auch neue Spalten zu einem DataFrame hinzufügen. Dies wird als Transformieren, Mutieren oder Feature Engineering bezeichnet.
Du kannst weitere Spalten von Grund auf neu erstellen oder sie einfach von anderen Spalten ableiten, zum Beispiel indem du Spalten zusammenfügst oder ihre Einheiten änderst.
homelessness ist ein DataFrame mit Datenschätzungen zur Obdachlosigkeit in jedem US-Bundesstaat im Jahr 2018. Die Spalte individual gibt die Anzahl der Obdachlosen an, die nicht zu einer Familie mit Kindern gehören. Die Spalte family_members gibt die Anzahl der Obdachlosen an, die zu einer Familie mit Kindern gehören. Die Spalte state_pop gibt die Gesamtbevölkerung des Bundesstaates an.
homelessness ist bereits verfügbar und pandas wurde als pd geladen.
Diese Übung ist Teil des Kurses
Datenbearbeitung mit pandas
Anleitung zur Übung
- Füge zu
homelessnesseine neue Spalte namenstotalhinzu, die die Summe der Spaltenindividualsundfamily_membersenthält. - Füge zu
homelessnesseine weitere Spalte namensp_homelesshinzu, die den Anteil der obdachlosen Bevölkerung insgesamt (total) an der Gesamtbevölkerung (state_pop) in jedem Bundesstaat enthält.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Add total col as sum of individuals and family_members
____
# Add p_homeless col as proportion of total homeless population to the state population
____
# See the result
print(homelessness)