LoslegenKostenlos loslegen

Zeilen auswählen

Data Scientists müssen herausfinden, welche Einträge in einem Datensatz besonders interessant sind. Eine der einfachsten Techniken, um das zu bewerkstelligen, ist das Erstellen einer Teilmenge mit Zeilen, die bestimmten Kriterien entsprechen. Das heißt, man möchte Zeilen filtern oder Zeilen auswählen.

Zum Erstellen solcher Teilmengen von DataFrames gibt es viele Optionen. Am gebräuchlichsten sind wohl relationale Operatoren, um True oder False für jede Zeile zurückzugeben. Das ganze Konstrukt muss in eckige Klammern gesetzt werden.

dogs[dogs["height_cm"] > 60]
dogs[dogs["color"] == "tan"]

Du kannst nach mehreren Bedingungen gleichzeitig filtern, indem du den bitweisen AND-Operator (&) verwendest.

dogs[(dogs["height_cm"] > 60) & (dogs["color"] == "tan")]

homelessness ist bereits verfügbar und pandas wurde als pd geladen.

Diese Übung ist Teil des Kurses

Datenbearbeitung mit pandas

Kurs anzeigen

Interaktive Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Filter for rows where individuals is greater than 10000
ind_gt_10k = ____

# See the result
print(ind_gt_10k)
Code bearbeiten und ausführen