Erste SchritteKostenlos loslegen

Kombi-Angriff!

Du hast die vier häufigsten Arten der Datenmanipulation kennengelernt: Zeilen sortieren, Teilmengen von Spalten auswählen, Teilmengen von Zeilen auswählen und neue Spalten hinzufügen. In einer realen Datenanalyse kannst du diese vier Techniken kombinieren, um eine Vielzahl von Fragen zu beantworten.

In dieser Übung beantwortest du die Frage: „Welcher US-Bundesstaat hat die höchste Anzahl von Obdachlosen pro 10.000 Einwohner?“ Kombiniere deine neuen pandas-Fähigkeiten, um es herauszufinden.

Diese Übung ist Teil des Kurses

Datenbearbeitung mit pandas

Kurs anzeigen

Anleitung zur Übung

  • Füge eine Spalte namens indiv_per_10k zu homelessness hinzu, die die Anzahl der Obdachlosen pro zehntausend Menschen in jedem Bundesstaat enthält. Nutze dabei state_pop für die Bevölkerung des Bundesstaates.
  • Erstelle eine Teilmenge mit Zeilen, in denen indiv_per_10k größer als 20 ist, und weise das Ergebnis high_homelessness zu.
  • Sortiere high_homelessness nach indiv_per_10k in absteigender Reihenfolge und weise das Ergebnis high_homelessness_srt zu.
  • Wähle nur die Spalten state und indiv_per_10k von high_homelessness_srt aus und speichere sie als result. Schau dir result an.

Interaktive Übung zum Anfassen

Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.

# Create indiv_per_10k col as homeless individuals per 10k state pop
homelessness["indiv_per_10k"] = 10000 * ____ / ____ 

# Subset rows for indiv_per_10k greater than 20
high_homelessness = ____

# Sort high_homelessness by descending indiv_per_10k
high_homelessness_srt = ____

# From high_homelessness_srt, select the state and indiv_per_10k cols
result = ____

# See the result
print(result)
Bearbeiten und Ausführen von Code