Zufällige Zeilenauswahl
In dieser Übung vergleichst du zwei Methoden zur zufälligen Auswahl von Zeilen (Einträgen) mit Zurücklegen in einem pandas DataFrame:
- Die eingebaute
pandas-Funktion.random() - Den
NumPy-Zufallszahlengenerator für ganze Zahlennp.random.randint()
In Statistik und Machine Learning trainieren wir ein Verfahren üblicherweise auf 75 % der verfügbaren Daten und testen die Leistung anschließend auf den verbleibenden 25 %.
Für diese Übung ziehen wir jeweils mit jeder der oben genannten Methoden zufällig 75 % aller verfügbaren gespielten Pokerhände und prüfen, welche Methode hinsichtlich der Ausführungszeit effizienter ist.
Diese Übung ist Teil des Kurses
<Kurs>Effizient mit pandas programmieren</Kurs>Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Extract number of rows in dataset
N=poker_hands.shape[0]
# Select and time the selection of the 75% of the dataset's rows
rand_start_time = time.time()
poker_hands.iloc[np.random.randint(____=0, high=____, ____=int(0.75 * N))]
print("Time using Numpy: {} sec".format(time.time() - rand_start_time))