Dummyvariabelen
In de laatste oefening van de cursus bereid je je data voor op modelleren door je niet-numerieke kolommen te dummy-encoden.
Als je bijvoorbeeld een kolom met geslachtswaarden hebt, 'Male' en 'Female', wil je aparte kolommen die aangeven of de observatie van een 'Male' of een 'Female' is. Dit proces van het maken van dummyvariabelen heet ook wel one-hot encoding.
Je kunt de functie get_dummies() van pandas gebruiken om de niet-numerieke kolommen om te zetten naar dummyvariabelen.
df_new = pd.get_dummies(df)
We hebben de flights DataFrame gefilterd tot flights_sub om het makkelijker te maken te zien wat er gebeurt.
Deze oefening maakt deel uit van de cursus
Python voor R-gebruikers
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Look at the head of flights_sub
print(____)