De onderliggende arrays gebruiken in plaats van .iloc
Nu je beter begrijpt hoe een DataFrame onder de motorkap werkt, gaan we een eerdere analyse aanpassen zodat die de onderliggende arrays van een DataFrame benut. Je kijkt opnieuw naar de berekening van winstpercentages die je eerder rij voor rij deed met de .iloc-methode:
def calc_win_perc(wins, games_played):
win_perc = wins / games_played
return np.round(win_perc,2)
win_percs_list = []
for i in range(len(baseball_df)):
row = baseball_df.iloc[i]
wins = row['W']
games_played = row['G']
win_perc = calc_win_perc(wins, games_played)
win_percs_list.append(win_perc)
baseball_df['WP'] = win_percs_list
Laten we deze analyse updaten om arrays te gebruiken in plaats van de .iloc-methode. Een DataFrame (baseball_df) is in je sessie geladen.
Deze oefening maakt deel uit van de cursus
Efficiënte Python-code schrijven
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Use the W array and G array to calculate win percentages
win_percs_np = calc_win_perc(baseball_df[____].____, baseball_df[____].____)