Kolommen selecteren: .iloc[] vs op naam
In de vorige oefening zag je hoe je met .loc[] en .iloc[] specifieke rijen van een DataFrame kunt ophalen (op basis van de index). Het blijkt dat .iloc[] dit een stuk sneller doet (ongeveer 2 keer)!
Een andere belangrijke taak is het vinden van de snelste manier om features (kolommen) van een DataFrame te selecteren. In deze oefening vergelijken we het volgende:
- de indexlocator
.iloc()gebruiken - de namen van de kolommen gebruiken We kunnen met beide methoden dezelfde taak uitvoeren, maar we willen weten welke het snelst is.
In deze oefening werk je verder met de pokerdata in poker_hands. Neem even de tijd om de structuur van dit DataFrame te bekijken door poker_hands.head() in de console aan te roepen!
Deze oefening maakt deel uit van de cursus
Efficiënte code schrijven met pandas
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Use .iloc to select the first, fourth, fifth, seventh and eighth column and record the times before and after
iloc_start_time = ___
cols = poker_hands.___[___,[0,3,___,___,___]]
iloc_end_time = ___
# Print the time it took
print("Time using .iloc[] : {} sec".format(___ - ___))