Escala de datos de peces para la agrupación
Se te da una matriz samples
que da las medidas de los peces. Cada fila representa un pez individual. Las medidas, como el peso en gramos, la longitud en centímetros y la relación porcentual entre altura y longitud, tienen escalas muy diferentes. Para agrupar estos datos eficazmente, primero tendrás que normalizar estas características. En este ejercicio, construirás una canalización para normalizar y agrupar los datos.
Estos datos de medición de peces proceden del Journal of Statistics Education.
Este ejercicio forma parte del curso
Aprendizaje no supervisado en Python
Instrucciones de ejercicio
Importa:
make_pipeline
desklearn.pipeline
.StandardScaler
desklearn.preprocessing
.KMeans
desklearn.cluster
.
Crea una instancia de la clase
StandardScaler
denominadoscaler
.Crea una instancia de
KMeans
con4
clústeres llamadakmeans
.Crea una canalización llamada
pipeline
que encadenescaler
ykmeans
. Para ello, solo tienes que pasarlos como argumentos amake_pipeline()
.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Perform the necessary imports
from ____ import ____
from ____ import ____
from ____ import ____
# Create scaler: scaler
scaler = ____
# Create KMeans instance: kmeans
kmeans = ____
# Create pipeline: pipeline
pipeline = ____