1. Nauka
  2. /
  3. Kursy
  4. /
  5. Przewidywanie CTR z użyciem uczenia maszynowego w Pythonie

Connected

ćwiczenie

Normalizacja logarytmiczna

Standaryzacja jest ważna, aby upewnić się, że wszystkie cechy są porównywalne. Normalizacja logarytmiczna to jedna z popularnych metod standaryzacji. Sprawdzisz wariancję wybranych cech i obliczysz ogólną medianę wariancji. Pod uwagę weźmiesz cechy numeryczne, z wyjątkiem kolumny click, banner_pos, device_type oraz kolumn search_engine_type, product_type, advertiser_type z poprzedniej lekcji – są to bowiem kolumny kategoryczne. Następnie zastosujesz normalizację logarytmiczną do kolumn o wariancji wyższej niż mediana wariancji i sprawdzisz wyniki.

Moduł pandas jest dostępny jako pd w twoim środowisku, a przykładowy DataFrame jest wczytany jako df.

Instrukcje 1/2

undefined XP
    1
    2
  • Wybierz kolumny numeryczne i wyklucz określone kolumny, używając .isin() na filter_cols.
  • Wyświetl wariancję każdej kolumny za pomocą .var() (nie zapomnij o nawiasach!).
  • Oblicz i wyświetl medianę wariancji, używając .median().