Und nun alles zusammen!
Du hast die vier häufigsten Datenbearbeitungen kennengelernt: Zeilen sortieren, bestimmte Spalten auswählen, bestimmte Zeilen auswählen und neue Spalten hinzufügen. In einer realen Datenanalyse kannst du diese vier Techniken kombinieren, um eine Vielzahl von Fragen zu beantworten.
In dieser Übung beantwortest du die konkrete Frage: „Welcher US-Bundesstaat hat die höchste Anzahl von Obdachlosen pro 10.000 Einwohner?“ Kombiniere deine neuen pandas
-Fähigkeiten, um die Antwort zu finden!
Diese Übung ist Teil des Kurses
Datenbearbeitung mit pandas
Anleitung zur Übung
- Füge eine Spalte namens
indiv_per_10k
zuhomelessness
hinzu, die die Anzahl der Obdachlosen pro 10.000 Menschen in jedem Bundesstaat enthält. Die Bevölkerung des jeweiligen Bundesstaates ist instate_pop
zu finden. - Wähle alle Zeilen aus, in denen
indiv_per_10k
größer als20
ist, und weise das Ergebnishigh_homelessness
zu. - Sortiere
high_homelessness
nachindiv_per_10k
in absteigender Reihenfolge und weise das Ergebnishigh_homelessness_srt
zu. - Wähle nur die Spalten
state
undindiv_per_10k
vonhigh_homelessness_srt
aus und speichere sie alsresult
. Schau dirresult
an.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Create indiv_per_10k col as homeless individuals per 10k state pop
homelessness["indiv_per_10k"] = 10000 * ____ / ____
# Subset rows for indiv_per_10k greater than 20
high_homelessness = ____
# Sort high_homelessness by descending indiv_per_10k
high_homelessness_srt = ____
# From high_homelessness_srt, select the state and indiv_per_10k cols
result = ____
# See the result
print(result)