1. Nauka
  2. /
  3. Kursy
  4. /
  5. Przewidywanie CTR z użyciem uczenia maszynowego w Pythonie

Connected

ćwiczenie

Ocena czterech kategorii

Macierz pomyłek to najprostsze narzędzie do analizy czterech kategorii wyników: prawdziwych pozytywów (TP), fałszywych pozytywów (FP), prawdziwych negatywów (TN) i fałszywych negatywów (FN). W tym ćwiczeniu użyjesz standardowego klasyfikatora drzewa decyzyjnego DecisionTreeClassifier() z biblioteki sklearn na przykładowych danych dotyczących kliknięć i obliczysz rozkład wyników według tych czterech kategorii.

Moduł pandas jest dostępny jako pd w twoim środowisku, a przykładowy DataFrame jest wczytany jako df. Cechy są wczytane do zmiennej X, a zmienna docelowa do y. Ponadto dostępna jest klasa DecisionTreeClassifier z modułu sklearn.tree.

Instrukcje

100 XP
  • Utwórz podziały na zbiory treningowy i testowy dla X i y.
  • Zdefiniuj klasyfikator drzewa decyzyjnego i wygeneruj prognozy y_pred, dopasowując model.
  • Użyj macierzy pomyłek, aby uzyskać liczności dla poszczególnych kategorii wyników – gdzie 1 oznacza przypadek pozytywny (kliknięcie), a 0 – przypadek negatywny (brak kliknięcia).
  • Na przykład: prawdziwe negatywy to [0,0], a prawdziwe pozytywy to [1,1].