1. Nauka
  2. /
  3. Kursy
  4. /
  5. Projektowanie przepływów pracy uczenia maszynowego w Pythonie

Connected

ćwiczenie

Ponowne spojrzenie na kontaminację

Zauważasz, że jednoklasowa SVM nie ma parametru contamination. Wiesz już jednak, że kontrolowanie odsetka przykładów oznaczanych jako nowości jest niezbędne do zarządzania wskaźnikiem fałszywie pozytywnych wyników. Postanawiasz więc poeksperymentować z progowaniem wyników. Detektor został zaimportowany jako onesvm, a do dyspozycji masz dane X_train, X_test, y_train, y_test, bibliotekę numpy jako np oraz funkcję confusion_matrix().

Instrukcje

100 XP
  • Dopasuj jednoklasową SVM i oceń dane testowe.
  • Oblicz zaobserwowany odsetek wartości odstających w danych testowych.
  • Użyj np.quantile(), aby wyznaczyć próg dla wyników odpowiadający temu odsetkowi.
  • Zastosuj ten próg do etykietowania danych testowych. Wyświetl macierz pomyłek.