Selección de filas: loc[] vs iloc[]
Una parte clave de trabajar con DataFrames es localizar entradas específicas en el conjunto de datos. Puedes localizar filas de dos maneras:
- Por un valor concreto de una columna (feature).
- Por el índice de las filas (index). En este ejercicio, nos centraremos en la segunda manera.
Si ya has trabajado con pandas, te sonarán los indexadores .loc e .iloc, que significan “location” e “index location”, respectivamente. En la mayoría de los casos, los índices coinciden con la posición de cada fila en el DataFrame (por ejemplo, la fila con índice 13 será la entrada número 14).
Aunque podemos usar ambas funciones para hacer la misma tarea, nos interesa saber cuál es más eficiente en términos de velocidad.
Este ejercicio forma parte del curso
Escribir código eficiente con pandas
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Define the range of rows to select: row_nums
row_nums = range(0, 1000)
# Select the rows using .loc[] and row_nums and record the time before and after
loc_start_time = time.time()
rows = poker_hands.____[____]
loc_end_time = ___
# Print the time it took to select the rows using .loc[]
print("Time using .loc[]: {} sec".format(___ - ___))