ComenzarEmpieza gratis

Selección de columnas: .iloc[] vs por nombre

En el ejercicio anterior viste cómo las funciones .loc[] y .iloc[] pueden usarse para localizar filas específicas de un DataFrame (según el índice). Resulta que para esta tarea, .iloc[] es mucho más rápida (unas ~2 veces).

Otra tarea importante es encontrar la función más rápida para seleccionar las características (columnas) objetivo de un DataFrame. En este ejercicio compararemos lo siguiente:

  • usar el localizador por índice .iloc()
  • usar los nombres de las columnas Aunque con ambas opciones podemos hacer lo mismo, nos interesa cuál es más eficiente en términos de velocidad.

En este ejercicio seguirás trabajando con los datos de póquer almacenados en poker_hands. ¡Tómate un momento para revisar la estructura de este DataFrame ejecutando poker_hands.head() en la consola!

Este ejercicio forma parte del curso

Escribir código eficiente con pandas

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Use .iloc to select the first, fourth, fifth, seventh and eighth column and record the times before and after
iloc_start_time = ___
cols = poker_hands.___[___,[0,3,___,___,___]]
iloc_end_time = ___

# Print the time it took
print("Time using .iloc[] : {} sec".format(___ - ___))
Editar y ejecutar código