Und nun alles zusammen!
Du hast die vier häufigsten Datenbearbeitungen kennengelernt: Zeilen sortieren, bestimmte Spalten auswählen, bestimmte Zeilen auswählen und neue Spalten hinzufügen. In einer realen Datenanalyse kannst du diese vier Techniken kombinieren, um eine Vielzahl von Fragen zu beantworten.
In dieser Übung beantwortest du die konkrete Frage: „Welcher US-Bundesstaat hat die höchste Anzahl von Obdachlosen pro 10.000 Einwohner?“ Kombiniere deine neuen pandas-Fähigkeiten, um die Antwort zu finden!
Diese Übung ist Teil des Kurses
Datenbearbeitung mit pandas
Anleitung zur Übung
- Füge eine Spalte namens
indiv_per_10kzuhomelessnesshinzu, die die Anzahl der Obdachlosen pro 10.000 Menschen in jedem Bundesstaat enthält. Die Bevölkerung des jeweiligen Bundesstaates ist instate_popzu finden. - Wähle alle Zeilen aus, in denen
indiv_per_10kgrößer als20ist, und weise das Ergebnishigh_homelessnesszu. - Sortiere
high_homelessnessnachindiv_per_10kin absteigender Reihenfolge und weise das Ergebnishigh_homelessness_srtzu. - Wähle nur die Spalten
stateundindiv_per_10kvonhigh_homelessness_srtaus und speichere sie alsresult. Schau dirresultan.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create indiv_per_10k col as homeless individuals per 10k state pop
homelessness["indiv_per_10k"] = 10000 * ____ / ____
# Subset rows for indiv_per_10k greater than 20
high_homelessness = ____
# Sort high_homelessness by descending indiv_per_10k
high_homelessness_srt = ____
# From high_homelessness_srt, select the state and indiv_per_10k cols
result = ____
# See the result
print(result)