LoslegenKostenlos starten

Zufällige Zeilenauswahl

In dieser Übung vergleichst du zwei Methoden zur zufälligen Auswahl von Zeilen (Einträgen) mit Zurücklegen in einem pandas DataFrame:

  • Die eingebaute pandas-Funktion .random()
  • Den NumPy-Zufallszahlengenerator für ganze Zahlen np.random.randint()

In Statistik und Machine Learning trainieren wir ein Verfahren üblicherweise auf 75 % der verfügbaren Daten und testen die Leistung anschließend auf den verbleibenden 25 %.

Für diese Übung ziehen wir jeweils mit jeder der oben genannten Methoden zufällig 75 % aller verfügbaren gespielten Pokerhände und prüfen, welche Methode hinsichtlich der Ausführungszeit effizienter ist.

Diese Übung ist Teil des Kurses

<Kurs>Effizient mit pandas programmieren</Kurs>
Kurs ansehen

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Extract number of rows in dataset
N=poker_hands.shape[0]

# Select and time the selection of the 75% of the dataset's rows
rand_start_time = time.time()
poker_hands.iloc[np.random.randint(____=0, high=____, ____=int(0.75 * N))]
print("Time using Numpy: {} sec".format(time.time() - rand_start_time))
Code bearbeiten und ausführen