Este ejercicio forma parte del curso
Los Árboles de clasificación y regresión (CART) son un conjunto de modelos de aprendizaje supervisado que se utilizan para problemas de clasificación y regresión. En este capítulo, conocerás el algoritmo CART.
El equilibrio entre sesgo y varianza es uno de los conceptos fundamentales del machine learning supervisado. En este capítulo, comprenderás cómo diagnosticar los problemas de sobreajuste e infraajuste. También conocerás el concepto de ensamblaje, que consiste en agregar las predicciones de varios modelos para obtener predicciones más sólidas.
El bagging es un método de ensamblaje que consiste en entrenar el mismo algoritmo muchas veces utilizando diferentes subconjuntos muestreados de los datos de entrenamiento. En este capítulo, comprenderás cómo puede utilizarse el bagging para crear un conjunto de árboles. También aprenderás cómo el algoritmo de los bosques aleatorios puede conducir a una mayor diversidad del conjunto mediante la aleatorización a nivel de cada división en los árboles que forman el conjunto.
Ejercicio actual
El refuerzo se refiere a un método conjunto en el que se entrenan varios modelos secuencialmente y cada modelo aprende de los errores de sus predecesores. En este capítulo, conocerás los dos métodos de refuerzo: AdaBoost y Gradient Boosting (potenciación del gradiente).
Los hiperparámetros de un modelo de machine learning son parámetros que no se aprenden a partir de los datos. Deben fijarse antes de ajustar el modelo al conjunto de entrenamiento. En este capítulo, aprenderás a ajustar los hiperparámetros de un modelo basado en árboles utilizando la validación cruzada de búsqueda en cuadrícula.