Zeilenauswahl: loc[] vs iloc[]
Ein großer Teil der Arbeit mit DataFrames besteht darin, gezielt Einträge im Datensatz zu finden. Zeilen kannst du auf zwei Arten lokalisieren:
- Über einen bestimmten Wert einer Spalte (Feature).
- Über den Index der Zeilen (Index). In dieser Übung konzentrieren wir uns auf die zweite Methode.
Wenn du bereits mit pandas gearbeitet hast, kennst du wahrscheinlich die Indexer .loc und .iloc, die für „location“ bzw. „index location“ stehen. In den meisten Fällen entsprechen die Indizes der Position jeder Zeile im DataFrame (z. B. ist die Zeile mit Index 13 der 14. Eintrag).
Auch wenn wir mit beiden Funktionen dieselbe Aufgabe lösen können, interessiert uns hier, welche in Bezug auf die Ausführungsgeschwindigkeit effizienter ist.
Diese Übung ist Teil des Kurses
Effizient mit pandas programmieren
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Define the range of rows to select: row_nums
row_nums = range(0, 1000)
# Select the rows using .loc[] and row_nums and record the time before and after
loc_start_time = time.time()
rows = poker_hands.____[____]
loc_end_time = ___
# Print the time it took to select the rows using .loc[]
print("Time using .loc[]: {} sec".format(___ - ___))