CommencerCommencer gratuitement

Sélection de lignes : loc[] vs iloc[]

Une grande partie du travail avec les DataFrames consiste à repérer des entrées précises dans le jeu de données. Vous pouvez sélectionner des lignes de deux façons :

  • Par une valeur spécifique d’une colonne (feature).
  • Par l’index des lignes (index). Dans cet exercice, nous nous concentrons sur la deuxième méthode.

Si vous avez déjà utilisé pandas, vous connaissez sûrement les indexeurs .loc et .iloc, qui signifient respectivement « location » et « index location ». Le plus souvent, les index correspondent à la position de chaque ligne dans le DataFrame (par exemple, la ligne d’index 13 sera la 14e entrée).

Même si les deux méthodes permettent d’accomplir la même tâche, nous cherchons à savoir laquelle est la plus efficace en termes de vitesse.

Cet exercice fait partie du cours

Écrire du code efficace avec pandas

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Define the range of rows to select: row_nums
row_nums = range(0, 1000)

# Select the rows using .loc[] and row_nums and record the time before and after
loc_start_time = time.time()
rows = poker_hands.____[____]
loc_end_time = ___

# Print the time it took to select the rows using .loc[]
print("Time using .loc[]: {} sec".format(___ - ___))
Modifier et exécuter le code