Zeilen nach kategorialen Variablen auswählen
Beim Filtern von Daten anhand einer kategorialen Variable wird oft der or-Operator (|) verwendet, um Zeilen aus mehreren Kategorien auszuwählen. Das kann aber mühsam werden, wenn du zum Beispiel alle Bundesstaaten in drei verschiedenen Regionen auswählen willst.
Eine Alternative ist hier die Methode .isin(), mit der du für dieses Problem nur eine Bedingung anstelle von drei einzelnen Bedingungen angeben musst.
colors = ["brown", "black", "tan"]
condition = dogs["color"].isin(colors)
dogs[condition]
homelessness ist bereits verfügbar und pandas wurde als pd geladen.
Diese Übung ist Teil des Kurses
Datenbearbeitung mit pandas
Anleitung zur Übung
Filtere „ homelessness ” für Fälle, in denen die US-Volkszählung „ state ” in der Liste der Mojave-Bundesstaaten „ canu ” aufgeführt ist, und ordne sie „ mojave_homelessness ” zu. Sieh dir das ausgegebene Ergebnis an.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# The Mojave Desert states
canu = ["California", "Arizona", "Nevada", "Utah"]
# Filter for rows in the Mojave Desert states
mojave_homelessness = homelessness[____]
# See the result
print(mojave_homelessness)