Selección aleatoria de filas
En este ejercicio, compararás dos métodos para seleccionar filas (entradas) aleatorias con reemplazo en un DataFrame de pandas:
- La función integrada de
pandas.random() - El generador de enteros aleatorios de
NumPynp.random.randint()
En general, en estadística y Machine Learning, cuando necesitamos entrenar un algoritmo, lo entrenamos con el 75% de los datos disponibles y evaluamos su rendimiento con el 25% restante.
Para este ejercicio, extraeremos aleatoriamente el 75% de todas las manos de póker jugadas disponibles, usando cada uno de los métodos anteriores, y veremos cuál es más eficiente en tiempo de ejecución.
Este ejercicio forma parte del curso
Escribir código eficiente con pandas
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Extract number of rows in dataset
N=poker_hands.shape[0]
# Select and time the selection of the 75% of the dataset's rows
rand_start_time = time.time()
poker_hands.iloc[np.random.randint(____=0, high=____, ____=int(0.75 * N))]
print("Time using Numpy: {} sec".format(time.time() - rand_start_time))