Zeilen nach kategorialen Variablen auswählen
Beim Filtern von Daten anhand einer kategorialen Variable wird oft der or-Operator (|) verwendet, um Zeilen aus mehreren Kategorien auszuwählen. Das kann aber mühsam werden, wenn du zum Beispiel alle Bundesstaaten in drei verschiedenen Regionen auswählen willst.
Eine Alternative ist hier die Methode .isin(), mit der du für dieses Problem nur eine Bedingung anstelle von drei einzelnen Bedingungen angeben musst.
colors = ["brown", "black", "tan"]
condition = dogs["color"].isin(colors)
dogs[condition]
homelessness ist bereits verfügbar und pandas wurde als pd geladen.
Diese Übung ist Teil des Kurses
<Kurs>Datenbearbeitung mit pandas</Kurs>Übungsanweisungen
Filtert homelessness für Fälle, in denen die US-Volkszählungs- state in der Liste der Mojave-Bundesstaaten canu auftaucht, und ordnet sie mojave_homelessness zu. Sieh dir das ausgegebene Ergebnis an.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# The Mojave Desert states
canu = ["California", "Arizona", "Nevada", "Utah"]
# Filter for rows in the Mojave Desert states
mojave_homelessness = homelessness[____]
# See the result
print(mojave_homelessness)