Statistiques d’EDA
Comme indiqué dans le diaporama, vous allez travailler sur les données de prédiction des courses de taxi de New York. Commencez par calculer quelques statistiques de base sur les données. Puis vous passerez à la visualisation de certaines dépendances et formulerez des hypothèses à leur sujet.
Les DataFrames train et test sont déjà disponibles dans votre espace de travail.
Cet exercice fait partie du cours
Gagner une compétition Kaggle en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Shapes of train and test data
print('Train shape:', ____.____)
print('Test shape:', ____.____)
# Train head()
print(____.____())