Willekeurige rijen selecteren
In deze oefening vergelijk je de twee methoden om willekeurige rijen (entries) met terugleggen te selecteren in een pandas DataFrame:
- De ingebouwde
pandas-functie.random() - De
NumPy-generator voor willekeurige gehele getallennp.random.randint()
In statistiek en Machine Learning trainen we een algoritme meestal op 75% van de beschikbare data en testen we de prestaties op de overige 25%.
In deze oefening nemen we willekeurig 75% van alle gespeelde pokerhanden, met elk van de bovenstaande methoden, en kijken we welke methode sneller is.
Deze oefening maakt deel uit van de cursus
Efficiënte code schrijven met pandas
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Extract number of rows in dataset
N=poker_hands.shape[0]
# Select and time the selection of the 75% of the dataset's rows
rand_start_time = time.time()
poker_hands.iloc[np.random.randint(____=0, high=____, ____=int(0.75 * N))]
print("Time using Numpy: {} sec".format(time.time() - rand_start_time))