Agrupación de los datos de los peces
Ahora utilizarás tu proceso de normalización y agrupación del ejercicio anterior para agrupar los peces según sus medidas, y luego crearás una tabulación cruzada para comparar las etiquetas de los grupos con las especies de peces.
Como antes, samples
es la matriz 2D de medidas de los peces. Tu canalización está disponible como pipeline
, y la especie de cada muestra de peces viene dada por la lista species
.
Este ejercicio forma parte del curso
Aprendizaje no supervisado en Python
Instrucciones de ejercicio
- Importa
pandas
comopd
. - Ajusta la canalización a las medidas del pez
samples
. - Obtén las etiquetas de los grupos de
samples
utilizando el método.predict()
depipeline
. - Utilizando
pd.DataFrame()
, crea un DataFramedf
con dos columnas llamadas'labels'
y'species'
, utilizandolabels
yspecies
, respectivamente, para los valores de las columnas. - Utilizando
pd.crosstab()
, crea una tabulación cruzadact
dedf['labels']
ydf['species']
.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Import pandas
import pandas as pd
# Fit the pipeline to samples
____
# Calculate the cluster labels: labels
labels = ____
# Create a DataFrame with labels and species as columns: df
df = ____
# Create crosstab: ct
ct = ____
# Display ct
print(ct)