1. 学ぶ
  2. /
  3. コース
  4. /
  5. Procvičování otázek k pohovorům z oblasti Machine Learning v Pythonu

Connected

演習

Základní klasifikátor s logistickou regresí

V posledních 2 lekcích sis ukázal/a, jak důležitý je výběr příznaků v kontextu Machine Learning pohovorů. Další okruh otázek, na které se při takovém pohovoru určitě narazíš, se týká feature engineeringu a toho, jak pomáhá zlepšit výkon modelu.

V tomto cvičení vytvoříš nový příznak z datasetu loan_data z 1. kapitoly, porovnáš skóre přesnosti modelů logistické regrese na datech před feature engineeringem a po něm, a to porovnáním testovacích štítků s předpovězenými hodnotami cílové proměnné Loan Status.

Všechny potřebné balíčky jsou už naimportované: matplotlib.pyplot jako plt, seaborn jako sns, LogisticRegression z sklearn.linear_model, train_test_split z sklearn.model_selection a accuracy_score z sklearn.metrics.

Feature engineering je považován za krok předzpracování dat před samotným modelováním: Machine learning pipeline

指示1 / 4

undefined XP
  • 1
    • Natrénuj logistickou regresi na datasetu loan_data s cílovou proměnnou Loan Status jako y, vytvoř předpovědi a vyhodnoť skóre přesnosti natrénovaného modelu.
  • 2
    • Převeď Annual Income na měsíční hodnotu a vypočítej poměr Monthly Debt k monthly_income, výsledek ulož do proměnné dti_ratio.
  • 3
    • Převeď cílovou proměnnou na číselné hodnoty a kategoriální příznaky nahraď dummy proměnnými.
  • 4
    • Natrénuj logistickou regresi na datasetu loans_dti, vytvoř předpovědi a vyhodnoť skóre přesnosti modelu.