Und nun alles zusammen!

Du hast die vier häufigsten Datenbearbeitungen kennengelernt: Zeilen sortieren, bestimmte Spalten auswählen, bestimmte Zeilen auswählen und neue Spalten hinzufügen. In einer realen Datenanalyse kannst du diese vier Techniken kombinieren, um eine Vielzahl von Fragen zu beantworten.

In dieser Übung beantwortest du die konkrete Frage: „Welcher US-Bundesstaat hat die höchste Anzahl von Obdachlosen pro 10.000 Einwohner?“ Kombiniere deine neuen pandas-Fähigkeiten, um die Antwort zu finden!

Diese Übung ist Teil des Kurses

<Kurs>Datenbearbeitung mit pandas</Kurs>

Kurs ansehen

Übungsanweisungen

Füge eine Spalte namens indiv_per_10k zu homelessness hinzu, die die Anzahl der Obdachlosen pro 10.000 Menschen in jedem Bundesstaat enthält. Die Bevölkerung des jeweiligen Bundesstaates ist in state_pop zu finden.
Wähle alle Zeilen aus, in denen indiv_per_10k größer als 20 ist, und weise das Ergebnis high_homelessness zu.
Sortiere high_homelessness nach indiv_per_10k in absteigender Reihenfolge und weise das Ergebnis high_homelessness_srt zu.
Wähle nur die Spalten state und indiv_per_10k von high_homelessness_srt aus und speichere sie als result. Schau dir result an.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Create indiv_per_10k col as homeless individuals per 10k state pop
homelessness["indiv_per_10k"] = 10000 * ____ / ____ 

# Subset rows for indiv_per_10k greater than 20
high_homelessness = ____

# Sort high_homelessness by descending indiv_per_10k
high_homelessness_srt = ____

# From high_homelessness_srt, select the state and indiv_per_10k cols
result = ____

# See the result
print(result)

Code bearbeiten und ausführen