Zeilen nach kategorialen Variablen auswählen
Beim Filtern von Daten anhand einer kategorialen Variable wird oft der or
-Operator (|
) verwendet, um Zeilen aus mehreren Kategorien auszuwählen. Das kann aber mühsam werden, wenn du zum Beispiel alle Bundesstaaten in drei verschiedenen Regionen auswählen willst.
Eine Alternative ist hier die Methode .isin()
, mit der du für dieses Problem nur eine Bedingung anstelle von drei einzelnen Bedingungen angeben musst.
colors = ["brown", "black", "tan"]
condition = dogs["color"].isin(colors)
dogs[condition]
homelessness
ist bereits verfügbar und pandas
wurde als pd
geladen.
Diese Übung ist Teil des Kurses
Datenbearbeitung mit pandas
Anleitung zur Übung
Filtere „ homelessness
” für Fälle, in denen die US-Volkszählung „ state
” in der Liste der Mojave-Bundesstaaten „ canu
” aufgeführt ist, und ordne sie „ mojave_homelessness
” zu. Sieh dir das ausgegebene Ergebnis an.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# The Mojave Desert states
canu = ["California", "Arizona", "Nevada", "Utah"]
# Filter for rows in the Mojave Desert states
mojave_homelessness = homelessness[____]
# See the result
print(mojave_homelessness)