ComenzarEmpieza gratis

Equilibrio entre velocidad y precisión

En el último video, viste que hay dos controles que puedes ajustar para influir en el rendimiento de los random forests:

  • Número de árboles de decisión en cada bosque.
  • Número de variables usadas para dividir en los árboles de decisión.

Aumentar cualquiera de ellos puede mejorar la precisión del modelo de imputación, pero también hará que tarde más en ejecutarse. En este ejercicio, vas a explorar estas ideas tú mismo ajustando missForest() a los datos de biopics dos veces con configuraciones diferentes. Mientras sigues las instrucciones, fíjate en los errores que se imprimen y en el tiempo que tarda en ejecutarse el código.

Este ejercicio forma parte del curso

Tratamiento de datos faltantes con imputaciones en R

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Set number of trees to 5 and number of variables used for splitting to 2
imp_res <- missForest(biopics, ___ = ___, ___ = ___)

# Print the resulting imputation errors
print(___)
Editar y ejecutar código