Sélection de colonnes : .iloc[] vs par nom
Dans l’exercice précédent, vous avez vu comment les fonctions .loc[] et .iloc[] permettent de localiser des lignes spécifiques d’un DataFrame (via l’index). Il se trouve que .iloc[] est nettement plus rapide pour cette tâche (environ ×2) !
Autre point important : identifier la méthode la plus rapide pour sélectionner des variables (colonnes) ciblées dans un DataFrame. Dans cet exercice, nous allons comparer :
- l’utilisation du sélecteur par index
.iloc() - l’utilisation des noms de colonnes Même si les deux méthodes accomplissent la même tâche, nous voulons savoir laquelle est la plus efficace en termes de vitesse.
Dans cet exercice, vous continuez à travailler avec les données de poker stockées dans poker_hands. Prenez un instant pour examiner la structure de ce DataFrame en appelant poker_hands.head() dans la console !
Cet exercice fait partie du cours
Écrire du code efficace avec pandas
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Use .iloc to select the first, fourth, fifth, seventh and eighth column and record the times before and after
iloc_start_time = ___
cols = poker_hands.___[___,[0,3,___,___,___]]
iloc_end_time = ___
# Print the time it took
print("Time using .iloc[] : {} sec".format(___ - ___))