Selección aleatoria de filas
En este ejercicio, compararás dos métodos para seleccionar filas (entradas) aleatorias con reemplazo en un DataFrame de pandas:
- La función integrada de
pandas.random() - El generador de enteros aleatorios de
NumPynp.random.randint()
En general, en estadística y Machine Learning, cuando necesitamos entrenar un algoritmo, lo entrenamos con el 75% de los datos disponibles y evaluamos su rendimiento con el 25% restante.
Para este ejercicio, extraeremos aleatoriamente el 75% de todas las manos de póker jugadas disponibles, usando cada uno de los métodos anteriores, y veremos cuál es más eficiente en tiempo de ejecución.
Este ejercicio forma parte del curso
Escribir código eficiente con pandas
ejercicio interactivo práctico
Prueba este ejercicio completando este código de ejemplo.
# Extract number of rows in dataset
N=poker_hands.shape[0]
# Select and time the selection of the 75% of the dataset's rows
rand_start_time = time.time()
poker_hands.iloc[np.random.randint(____=0, high=____, ____=int(0.75 * N))]
print("Time using Numpy: {} sec".format(time.time() - rand_start_time))