ComenzarEmpieza gratis

Distribución de los valores de la variable objetivo

Estratificar por la variable objetivo al generar los conjuntos de entrenamiento y prueba garantiza que los valores de la variable objetivo tengan un rango similar en ambos conjuntos.

Como la división de los datos originales es aleatoria, la estratificación evita, por ejemplo, que todas las viviendas caras de home_sales caigan en el conjunto de prueba. En ese caso, tu modelo probablemente rendiría peor porque se entrenó con viviendas menos caras.

En este ejercicio, vas a calcular estadísticas descriptivas para la variable selling_price en los conjuntos de entrenamiento y prueba. Los tibbles home_training y home_test se han cargado del ejercicio anterior.

Este ejercicio forma parte del curso

Modelado con tidymodels en R

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Distribution of selling_price in training data
___ %>% 
  summarize(min_sell_price = ___,
            max_sell_price = ___,
            mean_sell_price = ___,
            sd_sell_price = ___)
Editar y ejecutar código