Zufällige Zeilenauswahl

In dieser Übung vergleichst du zwei Methoden zur zufälligen Auswahl von Zeilen (Einträgen) mit Zurücklegen in einem pandas DataFrame:

Die eingebaute pandas-Funktion .random()
Den NumPy-Zufallszahlengenerator für ganze Zahlen np.random.randint()

In Statistik und Machine Learning trainieren wir ein Verfahren üblicherweise auf 75 % der verfügbaren Daten und testen die Leistung anschließend auf den verbleibenden 25 %.

Für diese Übung ziehen wir jeweils mit jeder der oben genannten Methoden zufällig 75 % aller verfügbaren gespielten Pokerhände und prüfen, welche Methode hinsichtlich der Ausführungszeit effizienter ist.

Diese Übung ist Teil des Kurses

Effizient mit pandas programmieren

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Extract number of rows in dataset
N=poker_hands.shape[0]

# Select and time the selection of the 75% of the dataset's rows
rand_start_time = time.time()
poker_hands.iloc[np.random.randint(____=0, high=____, ____=int(0.75 * N))]
print("Time using Numpy: {} sec".format(time.time() - rand_start_time))

Code bearbeiten und ausführen