Zufällige Zeilenauswahl
In dieser Übung vergleichst du zwei Methoden zur zufälligen Auswahl von Zeilen (Einträgen) mit Zurücklegen in einem pandas DataFrame:
- Die eingebaute
pandas-Funktion.random() - Den
NumPy-Zufallszahlengenerator für ganze Zahlennp.random.randint()
In Statistik und Machine Learning trainieren wir ein Verfahren üblicherweise auf 75 % der verfügbaren Daten und testen die Leistung anschließend auf den verbleibenden 25 %.
Für diese Übung ziehen wir jeweils mit jeder der oben genannten Methoden zufällig 75 % aller verfügbaren gespielten Pokerhände und prüfen, welche Methode hinsichtlich der Ausführungszeit effizienter ist.
Diese Übung ist Teil des Kurses
Effizient mit pandas programmieren
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Extract number of rows in dataset
N=poker_hands.shape[0]
# Select and time the selection of the 75% of the dataset's rows
rand_start_time = time.time()
poker_hands.iloc[np.random.randint(____=0, high=____, ____=int(0.75 * N))]
print("Time using Numpy: {} sec".format(time.time() - rand_start_time))