1. Nauka
  2. /
  3. Kursy
  4. /
  5. Ćwiczenie statystycznych pytań rekrutacyjnych w R

Connected

ćwiczenie

Podejście ze zbiorem walidacyjnym

W rozdziale dotyczącym regresji liniowej dopasowałeś model regresji liniowej, który wyjaśnia wagę serca kotów na podstawie ich masy ciała. Rekruter prosi cię teraz o ocenę jakości modelu.

Aby odpowiedzieć na to pytanie, musisz wygenerować predykcje, które można porównać z rzeczywistymi wartościami. W podejściu ze zbiorem walidacyjnym dzielisz dane na dwie części.

Możesz to zrobić, losując najpierw próbkę zawierającą na przykład 80% numerów wierszy. Wybrane numery posłużą do wyodrębnienia zbioru treningowego. Pozostałe wiersze ramki danych zostaną użyte do testowania.

Pamiętaj, że:

rows <- c(1, 3)
df[-rows, ]

zwraca wszystkie wiersze oprócz pierwszego i trzeciego.

Zbiór danych cats jest dostępny w twoim środowisku.

Instrukcje 1/3

undefined XP
    1
    2
    3
  • Wylosuj 80% (po zaokrągleniu) numerów wierszy ze zbioru danych cats.