Verken testgegevens
Nu je naar de train-gegevens hebt gekeken, gaan we de testgegevens verkennen in de "Store Item Demand Forecasting Challenge". Onthoud dat de testgegevensset meestal één kolom minder bevat dan de train-set.
Die kolom, samen met het uitvoerformaat, staat in het voorbeeld van de inzending (sample submission). Voordat je verdergaat in de competitie, is het belangrijk dat je het verwachte outputformaat kent.
Daarom kijken we naar de kolommen van de testgegevensset en vergelijken we die met de train-kolommen. Daarnaast verkennen we het formaat van de sample submission. De DataFrame train is beschikbaar in je werkruimte.
Deze oefening maakt deel uit van de cursus
Een Kaggle-competitie winnen met Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
import pandas as pd
# Read the test data
test = ____.____('test.csv')
# Print train and test columns
print('Train columns:', train.____.tolist())
print('Test columns:', test.____.tolist())