1. Learn
  2. /
  3. Cursuri
  4. /
  5. Exersează întrebări de interviu pentru Machine Learning în Python

Connected

exercițiu

Clasificator de bază prin regresie logistică

În ultimele 2 lecții, ai văzut cât de valoroasă este selecția caracteristicilor în contextul interviurilor de machine learning. Un alt set de întrebări frecvente pe care le poți întâlni într-un interviu de machine learning se referă la ingineria caracteristicilor și la modul în care aceasta ajută la îmbunătățirea performanței modelelor.

În acest exercițiu, vei construi o caracteristică nouă pe setul de date loan_data din Capitolul 1, vei compara scorul de acuratețe al modelelor de Regresie Logistică înainte și după ingineria caracteristicilor, comparând etichetele de test cu valorile prezise ale variabilei țintă Loan Status.

Toate pachetele necesare au fost deja importate: matplotlib.pyplot ca plt, seaborn ca sns, LogisticRegression din sklearn.linear_model, train_test_split din sklearn.model_selection și accuracy_score din sklearn.metrics.

Ingineria caracteristicilor este considerată un pas de preprocesare înainte de modelare: Machine learning pipeline

Instrucțiuni 1/4

undefined XP
  • 1
    • Antrenează și aplică o Regresie Logistică pe loan_data, cu variabila țintă Loan Status ca y, și evaluează scorul de acuratețe al modelului antrenat.
  • 2
    • Convertește Annual Income la venit lunar și calculează raportul dintre Monthly Debt și monthly_income, stocând rezultatul în dti_ratio.
  • 3
    • Convertește variabila țintă la valori numerice și înlocuiește caracteristicile categoriale cu valori dummy.
  • 4
    • Antrenează și aplică o Regresie Logistică pe loans_dti și evaluează scorul de acuratețe al modelului antrenat.