1. Nauka
  2. /
  3. Kursy
  4. /
  5. Przewidywanie CTR z użyciem uczenia maszynowego w Pythonie

Connected

ćwiczenie

Tworzenie nowych cech

Inżynieria cech obejmuje również rzeczywiste tworzenie nowych cech. Jest to ważny krok, ponieważ model opiera się na tych cechach przy przewidywaniu wyników. W tym ćwiczeniu sprawdzisz właściwości trzech kolumn, które w danych wyglądają jak liczby całkowite, ale w rzeczywistości reprezentują wartości kategoryczne. Te trzy kolumny to: search_engine_type, product_type oraz advertiser_type. Stworzysz cechy zliczające dla tych 3 kolumn, a także dla device_id i site_id. Cechy zliczające reprezentują liczbę kliknięć dla każdej z tych kolumn i zostaną wykorzystane później do przewidywania.

Moduł pandas jest dostępny jako pd w twoim środowisku, a przykładowy DataFrame jest załadowany jako df.

Instrukcje

100 XP
  • Wyświetl łączną liczbę wartości oraz liczbę unikalnych wartości dla każdej cechy z listy feature_list.
  • Utwórz nowe cechy na podstawie cech z listy new_feature_list, zliczając liczbę kliknięć dla każdej cechy za pomocą metody .transform().