EmpezarEmpieza gratis

Selección aleatoria de filas

En este ejercicio, compararás dos métodos para seleccionar filas (entradas) aleatorias con reemplazo en un DataFrame de pandas:

  • La función integrada de pandas .random()
  • El generador de enteros aleatorios de NumPy np.random.randint()

En general, en estadística y Machine Learning, cuando necesitamos entrenar un algoritmo, lo entrenamos con el 75% de los datos disponibles y evaluamos su rendimiento con el 25% restante.

Para este ejercicio, extraeremos aleatoriamente el 75% de todas las manos de póker jugadas disponibles, usando cada uno de los métodos anteriores, y veremos cuál es más eficiente en tiempo de ejecución.

Este ejercicio forma parte del curso

Escribir código eficiente con pandas

Ver curso

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

# Extract number of rows in dataset
N=poker_hands.shape[0]

# Select and time the selection of the 75% of the dataset's rows
rand_start_time = time.time()
poker_hands.iloc[np.random.randint(____=0, high=____, ____=int(0.75 * N))]
print("Time using Numpy: {} sec".format(time.time() - rand_start_time))
Editar y ejecutar código