1. Learn
  2. /
  3. Courses
  4. /
  5. Obsługa brakujących danych z imputacją w R

Connected

Exercise

Kompromis między szybkością a dokładnością

W ostatnim filmie widziałeś, że istnieją dwa parametry, którymi możesz sterować, aby wpłynąć na wydajność lasów losowych:

  • Liczba drzew decyzyjnych w każdym lesie.
  • Liczba zmiennych używanych do podziałów w drzewach decyzyjnych.

Zwiększenie każdego z nich może poprawić dokładność modelu imputacji, ale jednocześnie wydłuży czas działania. W tym ćwiczeniu samodzielnie zbadasz te zależności, dopasowując missForest() do danych biopics dwukrotnie z różnymi ustawieniami. Wykonując kolejne kroki, zwróć uwagę na wyświetlane błędy oraz czas potrzebny do wykonania kodu.

Instructions 1/2

undefined XP
  • 1
    • Uruchom missForest() na zbiorze biopics z 5 drzewami decyzyjnymi i 2 zmiennymi używanymi do podziałów, a następnie wyświetl błąd imputacji.
  • 2
    • Uruchom missForest() na zbiorze biopics z 50 drzewami decyzyjnymi i 6 zmiennymi używanymi do podziałów, a następnie wyświetl błąd imputacji.