1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Zwycięstwo w konkursie Kaggle w Pythonie

Connected

Exercise

Średnie kodowanie celu

Na początek stworzysz funkcję implementującą średnie kodowanie celu. Pamiętaj, że musisz zrealizować dwa następujące kroki:

  1. Oblicz średnią na zbiorze treningowym i zastosuj ją do zbioru testowego
  2. Podziel zbiór treningowy na K foldów. Oblicz średnią out-of-fold dla każdego foldu i zastosuj ją do tego konkretnego foldu

Każdy z tych kroków zostanie zaimplementowany w osobnej funkcji: odpowiednio test_mean_target_encoding() i train_mean_target_encoding().

Finalna funkcja mean_target_encoding() przyjmuje jako argumenty: zbiory treningowy i testowy (DataFrames), nazwę kolumny kategorycznej do zakodowania, nazwę kolumny celu oraz parametr wygładzający alfa. Zwraca dwie wartości: nową cechę dla zbiorów treningowego i testowego.

Instrukcje 1/3

undefined XP
    1
    2
    3
  • Dodaj wygładzanie, aby uniknąć przeuczenia. W tym celu dodaj parametr \(\alpha\) do mianownika w obliczeniach train_statistics.
  • Zadbaj o obsługę nowych kategorii w danych testowych. Przekaż globalną średnią jako argument metody fillna().