EDA-statistieken
Zoals in de dia's is genoemd, werk je met gegevens voor het voorspellen van taxitarieven in New York City. Je begint met het bepalen van enkele basisstatistieken over de data. Daarna ga je afhankelijkheden plotten en daar hypotheses over formuleren.
De DataFrames train en test zijn al beschikbaar in je werkruimte.
Deze oefening maakt deel uit van de cursus
Een Kaggle-competitie winnen met Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Shapes of train and test data
print('Train shape:', ____.____)
print('Test shape:', ____.____)
# Train head()
print(____.____())