Train-test-splits
In deze oefening ga je de candy production-gegevensset opsplitsen in een train- en testset. Zoals je in de video-oefening hebt gezien, doe je dit zodat je de kwaliteit van je modelfit kunt testen als je klaar bent.
De candy production-gegevensset is alvast voor je ingeladen als candy en pyplot is ingeladen als plt.
Deze oefening maakt deel uit van de cursus
ARIMA-modellen in Python
Oefeninstructies
- Splits de tijdreeks in train- en testsets door te slicen met
datetime-indexen. Neem als trainset alles tot en met eind 2006 en als testset alles vanaf begin 2007. - Maak een
pyplot-as met de functiesubplots(). - Gebruik de
.plot()-methode van de DataFrame om de train- en testsets te plotten op de asax.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Split the data into a train and test set
candy_train = candy.____
candy_test = candy.____
# Create an axis
fig, ax = ____
# Plot the train and test sets on the axis ax
candy_train.____(ax=____)
candy_test.____(ax=____)
plt.show()