ComenzarEmpieza gratis

Estandarizar variables

Es importante asegurarte de que las variables de entrada para el cálculo de la distancia kNN estén estandarizadas usando la función scale(). La estandarización evita que variables con media o varianza grandes influyan de forma desproporcionada en la puntuación de distancia kNN.

Este ejercicio forma parte del curso

Introducción a la detección de anomalías en R

Ver curso

Instrucciones del ejercicio

  • Aplica la función summary() a los datos wine para calcular los valores de media, mínimo y máximo de pH y alcohol.
  • Usa la función scale() para crear una versión estandarizada de los datos wine llamada wine_scaled.
  • Vuelve a usar summary() sobre wine_scaled para comprobar que la media y los rangos han cambiado.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Without standardization, features have different scales
summary(wine)

# Standardize the wine columns
wine_scaled <- ___

# Standardized features have similar means and quartiles
___(___)
Editar y ejecutar código