Zeilen nach kategorialen Variablen auswählen
Beim Filtern von Daten anhand einer kategorialen Variable wird oft der OR-Operator |
verwendet, um Zeilen aus mehreren Kategorien auszuwählen. Das kann aber mühsam werden, wenn du zum Beispiel alle Bundesstaaten in einer von drei verschiedenen Regionen haben willst.
Verwende stattdessen die Methode .isin()
, mit der du dieses Problem mit einer einzigen Bedingung anstelle von drei einzelnen Bedingungen lösen kannst.
colors = ["brown", "black", "tan"]
condition = dogs["color"].isin(colors)
dogs[condition]
homelessness
ist bereits verfügbar und pandas
wurde als pd
geladen.
Diese Übung ist Teil des Kurses
Datenbearbeitung mit pandas
Anleitung zur Übung
Filtere homelessness
nach Fällen, in denen der Bundesstaat state
aus der US-Volkszählung zur Liste der sogenannten Mojave-Bundesstaaten gehört, die in der Variable canu
erfasst sind. Weise das Ergebnis mojave_homelessness
zu. Sieh dir das ausgegebene Ergebnis an.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# The Mojave Desert states
canu = ["California", "Arizona", "Nevada", "Utah"]
# Filter for rows in the Mojave Desert states
mojave_homelessness = homelessness[____]
# See the result
print(mojave_homelessness)