Spaltenauswahl: .iloc[] vs. nach Namen
In der vorherigen Übung hast du gesehen, wie die Funktionen .loc[] und .iloc[] verwendet werden, um bestimmte Zeilen eines DataFrames (basierend auf dem Index) zu finden. Es zeigt sich, dass .iloc[] diese Aufgabe deutlich schneller erledigt (etwa doppelt so schnell)!
Eine weitere wichtige Aufgabe ist es, die schnellere Methode zu finden, um gezielt Features (Spalten) eines DataFrames auszuwählen. In dieser Übung vergleichen wir Folgendes:
- die Verwendung des Index-Locators
.iloc() - die Verwendung der Spaltennamen Beide Methoden führen zum gleichen Ergebnis, uns interessiert jedoch, welche in Bezug auf die Ausführungszeit effizienter ist.
In dieser Übung arbeitest du weiter mit den Pokerdaten in poker_hands. Schau dir kurz die Struktur dieses DataFrames an, indem du poker_hands.head() in der Konsole aufrufst!
Diese Übung ist Teil des Kurses
Effizient mit pandas programmieren
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Use .iloc to select the first, fourth, fifth, seventh and eighth column and record the times before and after
iloc_start_time = ___
cols = poker_hands.___[___,[0,3,___,___,___]]
iloc_end_time = ___
# Print the time it took
print("Time using .iloc[] : {} sec".format(___ - ___))