Selección de columnas: .iloc[] vs por nombre
En el ejercicio anterior viste cómo las funciones .loc[] y .iloc[] pueden usarse para localizar filas específicas de un DataFrame (según el índice). Resulta que para esta tarea, .iloc[] es mucho más rápida (unas ~2 veces).
Otra tarea importante es encontrar la función más rápida para seleccionar las características (columnas) objetivo de un DataFrame. En este ejercicio compararemos lo siguiente:
- usar el localizador por índice
.iloc() - usar los nombres de las columnas Aunque con ambas opciones podemos hacer lo mismo, nos interesa cuál es más eficiente en términos de velocidad.
En este ejercicio seguirás trabajando con los datos de póquer almacenados en poker_hands. ¡Tómate un momento para revisar la estructura de este DataFrame ejecutando poker_hands.head() en la consola!
Este ejercicio forma parte del curso
Escribir código eficiente con pandas
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Use .iloc to select the first, fourth, fifth, seventh and eighth column and record the times before and after
iloc_start_time = ___
cols = poker_hands.___[___,[0,3,___,___,___]]
iloc_end_time = ___
# Print the time it took
print("Time using .iloc[] : {} sec".format(___ - ___))