1. Nauka
  2. /
  3. Kursy
  4. /
  5. Braki danych w Pythonie

Connected

ćwiczenie

Analiza podsumowania modelu liniowego

Ocena wydajności różnych modeli z uzupełnionymi danymi to jedno z kluczowych zadań w pracy z brakującymi wartościami. Pozwala określić, na którym uzupełnionym zbiorze danych można polegać. Do analizy dopasowujesz model regresji liniowej na uzupełnionym zbiorze danych i sprawdzasz różne parametry wpływające na wybór metody imputacji.

W tym ćwiczeniu zbiór danych diabetes_cc jest już wczytany – to kompletny przypadek zbioru danych o cukrzycy. Kompletny przypadek służy jako punkt odniesienia do porównania z innymi uzupełnionymi zbiorami danych. Do tworzenia modelu regresji liniowej i generowania podsumowań używasz pakietu statsmodels.api wczytanego jako sm.

Instrukcje 1/4

undefined XP
    1
    2
    3
    4
  • Ustaw wszystkie cechy ze zbioru danych diabetes_cc jako X, dodając stałą, a kolumnę 'Class' wyklucz i ustaw jako y.