Kaggle-Forum-Ideen testen
Leider sind nicht alle Forenbeiträge und Kernels zwangsläufig nützlich für dein Modell. Anstatt Ideen blind in deine Pipeline zu übernehmen, solltest du sie zuerst testen.
Dir steht die Funktion get_cv_score() zur Verfügung. Sie nimmt einen Trainingsdatensatz als Argument und gibt den gesamten Validierungs-Root-Mean-Squared-Error über eine 3-fache Kreuzvalidierung zurück. Das DataFrame train ist in deinem Workspace bereits vorhanden.
Probiere verschiedene Vorschläge aus dem Kaggle-Forum aus und prüfe, ob sie deinen Validierungsscore verbessern.
Diese Übung ist Teil des Kurses
Eine Kaggle-Competition in Python gewinnen
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Drop passenger_count column
new_train_1 = train.____('____', axis=1)
# Compare validation scores
initial_score = get_cv_score(train)
new_score = get_cv_score(new_train_1)
print('Initial score is {} and the new score is {}'.format(initial_score, new_score))