Zeilen auswählen
Data Scientists möchten oft herausfinden, welche Teile eines Datensatzes besonders interessant sind. Eine der einfachsten Techniken, um das zu bewerkstelligen, besteht darin, eine Teilmenge mit Zeilen zu finden, die bestimmten Kriterien entsprechen. Das heißt, sie möchten Zeilen filtern oder Zeilen auswählen.
Es gibt viele Möglichkeiten, Teilmengen von DataFrames auszuwählen. Am gebräuchlichsten sind wohl relationale Operatoren, um True
oder False
für jede Zeile zurückzugeben. Das Ganze wird dann in eckige Klammern gesetzt.
dogs[dogs["height_cm"] > 60]
dogs[dogs["color"] == "tan"]
Du kannst nach mehreren Bedingungen gleichzeitig filtern, indem du den bitweisen AND-Operator &
verwendest.
dogs[(dogs["height_cm"] > 60) & (dogs["color"] == "tan")]
homelessness
ist bereits verfügbar und pandas
wurde als pd
geladen.
Diese Übung ist Teil des Kurses
Datenbearbeitung mit pandas
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Filter for rows where individuals is greater than 10000
ind_gt_10k = ____
# See the result
print(ind_gt_10k)