Aan de slagBegin gratis

Verken testgegevens

Nu je naar de train-gegevens hebt gekeken, gaan we de testgegevens verkennen in de "Store Item Demand Forecasting Challenge". Onthoud dat de testgegevensset meestal één kolom minder bevat dan de train-set.

Die kolom, samen met het uitvoerformaat, staat in het voorbeeld van de inzending (sample submission). Voordat je verdergaat in de competitie, is het belangrijk dat je het verwachte outputformaat kent.

Daarom kijken we naar de kolommen van de testgegevensset en vergelijken we die met de train-kolommen. Daarnaast verkennen we het formaat van de sample submission. De DataFrame train is beschikbaar in je werkruimte.

Deze oefening maakt deel uit van de cursus

Een Kaggle-competitie winnen met Python

Bekijk cursus

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

import pandas as pd

# Read the test data
test = ____.____('test.csv')

# Print train and test columns
print('Train columns:', train.____.tolist())
print('Test columns:', test.____.tolist())
Code bewerken en uitvoeren