Kombi-Angriff!
Du hast die vier häufigsten Arten der Datenmanipulation kennengelernt: Zeilen sortieren, Teilmengen von Spalten auswählen, Teilmengen von Zeilen auswählen und neue Spalten hinzufügen. In einer realen Datenanalyse kannst du diese vier Techniken kombinieren, um eine Vielzahl von Fragen zu beantworten.
In dieser Übung beantwortest du die Frage: „Welcher US-Bundesstaat hat die höchste Anzahl von Obdachlosen pro 10.000 Einwohner?“ Kombiniere deine neuen pandas
-Fähigkeiten, um es herauszufinden.
Diese Übung ist Teil des Kurses
Datenbearbeitung mit pandas
Anleitung zur Übung
- Füge eine Spalte namens
indiv_per_10k
zuhomelessness
hinzu, die die Anzahl der Obdachlosen pro zehntausend Menschen in jedem Bundesstaat enthält. Nutze dabeistate_pop
für die Bevölkerung des Bundesstaates. - Erstelle eine Teilmenge mit Zeilen, in denen
indiv_per_10k
größer als20
ist, und weise das Ergebnishigh_homelessness
zu. - Sortiere
high_homelessness
nachindiv_per_10k
in absteigender Reihenfolge und weise das Ergebnishigh_homelessness_srt
zu. - Wähle nur die Spalten
state
undindiv_per_10k
vonhigh_homelessness_srt
aus und speichere sie alsresult
. Schau dirresult
an.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Create indiv_per_10k col as homeless individuals per 10k state pop
homelessness["indiv_per_10k"] = 10000 * ____ / ____
# Subset rows for indiv_per_10k greater than 20
high_homelessness = ____
# Sort high_homelessness by descending indiv_per_10k
high_homelessness_srt = ____
# From high_homelessness_srt, select the state and indiv_per_10k cols
result = ____
# See the result
print(result)