1. Learn
  2. /
  3. 课程
  4. /
  5. Exersează întrebări de interviu pentru Machine Learning în Python

Connected

道练习

Tehnici pentru multicolinearitate – ingineria caracteristicilor

Multicolinearitatea este o problemă frecventă care poate afecta performanța în orice context de învățare automată. Știind cum să abordezi acest detaliu, poți transforma o explicație a modelării din bună în excelentă și te poți diferenția cu adevărat într-un interviu.

În acest exercițiu, vei exersa crearea unui model de bază folosind Regresia Liniară pe setul de date diabetes și vei explora câteva dintre metricile de ieșire. Apoi vei aplica tehnici de explorare vizuală a corelației dintre variabilele independente, pentru ca în final să realizezi ingineria caracteristicilor pe 2 variabile cu corelație ridicată.

Pentru primii doi pași, folosește X_train, X_test, y_train și y_test, care au fost importate în spațiul tău de lucru.

De asemenea, toate pachetele relevante au fost importate pentru tine: pandas ca pd, train_test_split din sklearn.model_selection, LinearRegression din sklearn.linear_model, mean_squared_error și r2_score din sklearn.metrics, matplotlib.pyplot ca plt și seaborn ca sns.

说明 1/4

undefined XP
  • 1
    • Instanțiază, antrenează și realizează predicții cu o Regresie Liniară.
    • Afișează coeficienții modelului, MSE și R-pătrat.
  • 2
    • Creează o matrice de corelație și vizualizeaz-o ca heatmap.
    • Afișează matricea pentru a explora relațiile dintre variabilele independente.
  • 3
    • Creează o nouă caracteristică combinând s1 și s2 din diabetes, apoi elimină-le.
    • Împarte datele în seturi de antrenament și testare cu 30% pentru testare și afișează numele coloanelor.
  • 4
    • Instanțiază, antrenează și realizează predicții cu o Regresie Liniară.
    • Afișează coeficienții modelului, MSE și R-pătrat.