Zeilen sortieren
Relevante Daten lassen sich in einem DataFrame oft schneller finden, wenn die Reihenfolge der Zeilen entsprechend geändert wird. Du kannst Zeilen sortieren, indem du einen Spaltennamen an .sort_values()
übergibst.
Wenn manche Zeilen denselben Wert haben (was beim Sortieren nach kategorialen Variablen häufig der Fall ist), kannst du die Sortierung anhand einer weiteren Spalte eindeutig festlegen. Um nach mehreren Spalten zu sortieren, übergib einfach eine Liste von Spaltennamen.
Sortieren nach … | Syntax |
---|---|
einer Spalte | df.sort_values("breed") |
mehreren Spalten | df.sort_values(["breed", "weight_kg"]) |
Wenn du .sort_values()
mit .head()
kombinierst, kannst du Fragen folgender Art beantworten: „Was sind die wichtigsten Fälle, in denen …?“
homelessness
ist bereits verfügbar und pandas
wurde als pd
geladen.
Diese Übung ist Teil des Kurses
Datenbearbeitung mit pandas
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Sort homelessness by individuals
homelessness_ind = ____
# Print the top few rows
print(____)