Aan de slagGa gratis aan de slag

Willekeurige rijen selecteren

In deze oefening vergelijk je de twee methoden om willekeurige rijen (entries) met terugleggen te selecteren in een pandas DataFrame:

  • De ingebouwde pandas-functie .random()
  • De NumPy-generator voor willekeurige gehele getallen np.random.randint()

In statistiek en Machine Learning trainen we een algoritme meestal op 75% van de beschikbare data en testen we de prestaties op de overige 25%.

In deze oefening nemen we willekeurig 75% van alle gespeelde pokerhanden, met elk van de bovenstaande methoden, en kijken we welke methode sneller is.

Deze oefening maakt deel uit van de cursus

Efficiënte code schrijven met pandas

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Extract number of rows in dataset
N=poker_hands.shape[0]

# Select and time the selection of the 75% of the dataset's rows
rand_start_time = time.time()
poker_hands.iloc[np.random.randint(____=0, high=____, ____=int(0.75 * N))]
print("Time using Numpy: {} sec".format(time.time() - rand_start_time))
Code bewerken en uitvoeren