Zeilen auswählen
Data Scientists müssen herausfinden, welche Einträge in einem Datensatz besonders interessant sind. Eine der einfachsten Techniken, um das zu bewerkstelligen, ist das Erstellen einer Teilmenge mit Zeilen, die bestimmten Kriterien entsprechen. Das heißt, man möchte Zeilen filtern oder Zeilen auswählen.
Zum Erstellen solcher Teilmengen von DataFrames gibt es viele Optionen. Am gebräuchlichsten sind wohl relationale Operatoren, um True
oder False
für jede Zeile zurückzugeben. Das ganze Konstrukt muss in eckige Klammern gesetzt werden.
dogs[dogs["height_cm"] > 60]
dogs[dogs["color"] == "tan"]
Du kannst nach mehreren Bedingungen gleichzeitig filtern, indem du den bitweisen AND-Operator (&
) verwendest.
dogs[(dogs["height_cm"] > 60) & (dogs["color"] == "tan")]
homelessness
ist bereits verfügbar und pandas
wurde als pd
geladen.
Diese Übung ist Teil des Kurses
Datenbearbeitung mit pandas
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Filter for rows where individuals is greater than 10000
ind_gt_10k = ____
# See the result
print(ind_gt_10k)