1. Nauka
  2. /
  3. Kursy
  4. /
  5. Zwycięstwo w konkursie Kaggle w Pythonie

Connected

ćwiczenie

Testowanie pomysłów z forum Kaggle

Niestety, nie wszystkie posty na forum ani Kernele muszą być przydatne dla twojego modelu. Zamiast ślepo wdrażać kolejne pomysły do swojego pipeline'u, najpierw je przetestuj.

Masz do dyspozycji funkcję get_cv_score(), która przyjmuje zbiór treningowy jako argument i zwraca ogólny błąd średniokwadratowy (RMSE) walidacji dla kroswalidacji 3-krotnej. DataFrame train jest już dostępny w twoim środowisku pracy.

Spróbuj zastosować różne sugestie z forum Kaggle i sprawdź, czy poprawiają wynik walidacji.

Instrukcje 1/2

undefined XP
  • 1
    • Sugestia 1: cecha passenger_count jest bezużyteczna. Sprawdźmy to! Usuń tę cechę i porównaj wyniki.
  • 2
    • Pierwsza sugestia okazała się trafna. Sugestia 2: suma pickup_latitude i distance_km to dobra cecha. Wypróbujmy ją!