Rijselectie: loc[] vs iloc[]
Een groot deel van werken met DataFrames is het terugvinden van specifieke items in de gegevensset. Rijen kun je op twee manieren lokaliseren:
- Op basis van een specifieke waarde in een kolom (feature).
- Op basis van de index van de rijen (index). In deze oefening focussen we op de tweede manier.
Als je al ervaring hebt met pandas, ken je waarschijnlijk de indexers .loc en .iloc, die respectievelijk staan voor 'location' en 'index location'. In de meeste gevallen komen de indexen overeen met de positie van elke rij in de DataFrame (bijv. de rij met index 13 is de 14e entry).
Hoewel we met beide functies dezelfde taak kunnen uitvoeren, zijn we geïnteresseerd in welke het snelst is.
Deze oefening maakt deel uit van de cursus
Efficiënte code schrijven met pandas
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Define the range of rows to select: row_nums
row_nums = range(0, 1000)
# Select the rows using .loc[] and row_nums and record the time before and after
loc_start_time = time.time()
rows = poker_hands.____[____]
loc_end_time = ___
# Print the time it took to select the rows using .loc[]
print("Time using .loc[]: {} sec".format(___ - ___))