CommencerCommencer gratuitement

Tester les idées du forum Kaggle

Malheureusement, tous les messages du Forum et les Kernels ne sont pas forcément utiles pour votre modèle. Plutôt que d’intégrer des idées à l’aveugle dans votre pipeline, vous devriez d’abord les tester.

On vous fournit une fonction get_cv_score() qui prend un jeu de données d’entraînement en argument et renvoie la racine de l’erreur quadratique moyenne de validation globale sur une validation croisée à 3 plis. Le DataFrame train est déjà disponible dans votre espace de travail.

Vous allez essayer différentes suggestions du forum Kaggle et vérifier si elles améliorent votre score de validation.

Cet exercice fait partie du cours

Gagner une compétition Kaggle en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Drop passenger_count column
new_train_1 = train.____('____', axis=1)

# Compare validation scores
initial_score = get_cv_score(train)
new_score = get_cv_score(new_train_1)

print('Initial score is {} and the new score is {}'.format(initial_score, new_score))
Modifier et exécuter le code