1. Learn
  2. /
  3. 课程
  4. /
  5. Předpovídání CTR pomocí Machine Learning v Pythonu

Connected

道练习

Logaritmická normalizace

Standardizace je důležitá k tomu, aby byly všechny příznaky vzájemně srovnatelné. Logaritmická normalizace je jednou z běžných metod standardizace. Podíváš se na rozptyl vybraných příznaků a vypočítáš celkový mediánový rozptyl. Pracovat budeš s numerickými příznaky – s výjimkou sloupce click, banner_pos, device_type a sloupců search_engine_type, product_type, advertiser_type z předchozí lekce, které jsou ve skutečnosti kategorické. Potom aplikuješ logaritmickou normalizaci na sloupce s rozptylem vyšším než mediánový rozptyl a ověříš výsledky.

Modul pandas je dostupný jako pd a vzorový DataFrame je načtený jako df.

说明 1 / 共 2 个

undefined XP
    1
    2
  • Vyber numerické sloupce a vyloučí konkrétní sloupce pomocí .isin() na filter_cols.
  • Vypiš rozptyl každého sloupce pomocí .var() (nezapomeň na závorky!).
  • Vypočítej a vypiš mediánový rozptyl pomocí .median().