ComenzarEmpieza gratis

Selección aleatoria de filas

En este ejercicio, compararás dos métodos para seleccionar filas (entradas) aleatorias con reemplazo en un DataFrame de pandas:

  • La función integrada de pandas .random()
  • El generador de enteros aleatorios de NumPy np.random.randint()

En general, en estadística y Machine Learning, cuando necesitamos entrenar un algoritmo, lo entrenamos con el 75% de los datos disponibles y evaluamos su rendimiento con el 25% restante.

Para este ejercicio, extraeremos aleatoriamente el 75% de todas las manos de póker jugadas disponibles, usando cada uno de los métodos anteriores, y veremos cuál es más eficiente en tiempo de ejecución.

Este ejercicio forma parte del curso

Escribir código eficiente con pandas

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Extract number of rows in dataset
N=poker_hands.shape[0]

# Select and time the selection of the 75% of the dataset's rows
rand_start_time = time.time()
poker_hands.iloc[np.random.randint(____=0, high=____, ____=int(0.75 * N))]
print("Time using Numpy: {} sec".format(time.time() - rand_start_time))
Editar y ejecutar código