1. 学ぶ
  2. /
  3. コース
  4. /
  5. Ćwiczenie pytań rekrutacyjnych z uczenia maszynowego w Pythonie

Connected

演習

Bazowy klasyfikator regresji logistycznej

W ostatnich 2 lekcjach poznałeś wartość selekcji cech w kontekście rozmów kwalifikacyjnych z uczenia maszynowego. Kolejny zestaw typowych pytań, których możesz się spodziewać, dotyczy inżynierii cech i tego, jak wpływa ona na poprawę wydajności modelu.

W tym ćwiczeniu przeprowadzisz inżynierię nowej cechy na zbiorze danych loan_data z Rozdziału 1, porównasz dokładność modeli regresji logistycznej na zbiorze danych przed inżynierią cech i po niej, zestawiając etykiety testowe z wartościami przewidywanymi dla zmiennej docelowej Loan Status.

Wszystkie niezbędne pakiety zostały już zaimportowane: matplotlib.pyplot jako plt, seaborn jako sns, LogisticRegression z sklearn.linear_model, train_test_split z sklearn.model_selection oraz accuracy_score z sklearn.metrics.

Inżynieria cech jest etapem wstępnego przetwarzania danych przed modelowaniem: Machine learning pipeline

指示1 / 4

undefined XP
  • 1
    • Dopasuj model regresji logistycznej do zbioru loan_data, używając zmiennej docelowej Loan Status jako y, wygeneruj prognozy i oceń dokładność wytrenowanego modelu.
  • 2
    • Przekształć kolumnę Annual Income na wartości miesięczne, a następnie oblicz wskaźnik udziału Monthly Debt w monthly_income i zapisz go w zmiennej dti_ratio.
  • 3
    • Przekształć zmienną docelową na wartości liczbowe i zastąp cechy kategoryczne wartościami dummy.
  • 4
    • Dopasuj model regresji logistycznej do zbioru loans_dti, wygeneruj prognozy i oceń dokładność wytrenowanego modelu.