1. Learn
  2. /
  3. คอร์ส
  4. /
  5. Ćwiczenie pytań rekrutacyjnych z uczenia maszynowego w Pythonie

Connected

แบบฝึกหัด

Techniki radzenia sobie z multikolinearnością – inżynieria cech

Multikolinearność to częsty problem, który może negatywnie wpływać na wyniki modelu uczenia maszynowego. Umiejętność omówienia tego szczegółu może podnieść jakość twoich wyjaśnień dotyczących modelowania na wyższy poziom i naprawdę wyróżnić cię podczas rozmowy kwalifikacyjnej.

W tym ćwiczeniu przećwiczysz tworzenie modelu bazowego z użyciem regresji liniowej na zbiorze danych diabetes oraz przeanalizujesz wybrane metryki wyjściowe. Następnie zastosujesz techniki wizualnej eksploracji korelacji między zmiennymi niezależnymi, a na koniec wykonasz inżynierię cech na 2 zmiennych o wysokiej korelacji.

W pierwszych dwóch krokach skorzystaj z X_train, X_test, y_train i y_test, które zostały już zaimportowane do twojego obszaru roboczego.

Wszystkie niezbędne pakiety zostały za ciebie zaimportowane: pandas jako pd, train_test_split z sklearn.model_selection, LinearRegression z sklearn.linear_model, mean_squared_error i r2_score z sklearn.metrics, matplotlib.pyplot jako plt oraz seaborn jako sns.

คำแนะนำ 1/4

undefined XP
  • 1
    • Utwórz, dopasuj i zastosuj model regresji liniowej.
    • Wydrukuj współczynniki modelu, błąd średniokwadratowy (MSE) i współczynnik determinacji R².
  • 2
    • Utwórz macierz korelacji i zwizualizuj ją na mapie ciepła.
    • Wydrukuj macierz, aby zbadać zależności między zmiennymi niezależnymi.
  • 3
    • Utwórz nową cechę, łącząc s1 i s2 ze zbioru diabetes, a następnie usuń te zmienne.
    • Podziel dane na zbiór treningowy i testowy z 30% udziałem danych testowych i wydrukuj nazwy kolumn.
  • 4
    • Utwórz, dopasuj i zastosuj model regresji liniowej.
    • Wydrukuj współczynniki modelu, błąd średniokwadratowy (MSE) i współczynnik determinacji R².