1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Obsługa brakujących danych z imputacją w R

Connected

Exercise

Regresja liniowa z niekompletnymi danymi

Brakujące dane to powszechny problem, a odpowiednie radzenie sobie z nimi jest niezwykle ważne. Ignorowanie brakujących wartości lub ich nieprawidłowe uzupełnianie może powodować, że modele będą działać w nieoczekiwany sposób, a prognozy i wnioski okażą się obciążone błędem.

W tym rozdziale będziesz pracować ze zbiorem danych biopics. Zawiera on informacje o wielu filmach biograficznych, w tym dane o ich przychodach, charakterystyce bohaterów i innych zmiennych. Część wartości jest jednak brakująca. Oryginalne dane pochodzą z pakietu R fivethirtyeight, ale w tym kursie będziesz korzystać z ich lekko przetworzonej wersji.

W tym ćwiczeniu zapoznasz się ze zbiorem danych i dopasowujesz model regresji liniowej wyjaśniający przychody filmów. Zaczynamy!

Instrukcje 1 / 4

undefined XP
    1
    2
    3
    4
  • Wyświetl pierwsze 10 obserwacji ze zbioru danych biopics i zapoznaj się ze zmiennymi.