ComenzarEmpieza gratis

Agrupación de los datos de los peces

Ahora utilizarás tu proceso de normalización y agrupación del ejercicio anterior para agrupar los peces según sus medidas, y luego crearás una tabulación cruzada para comparar las etiquetas de los grupos con las especies de peces.

Como antes, samples es la matriz 2D de medidas de los peces. Tu canalización está disponible como pipeline, y la especie de cada muestra de peces viene dada por la lista species.

Este ejercicio forma parte del curso

Aprendizaje no supervisado en Python

Ver curso

Instrucciones de ejercicio

  • Importa pandas como pd.
  • Ajusta la canalización a las medidas del pez samples.
  • Obtén las etiquetas de los grupos de samples utilizando el método .predict() de pipeline.
  • Utilizando pd.DataFrame(), crea un DataFrame df con dos columnas llamadas 'labels' y 'species', utilizando labels y species, respectivamente, para los valores de las columnas.
  • Utilizando pd.crosstab(), crea una tabulación cruzada ct de df['labels'] y df['species'].

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Import pandas
import pandas as pd

# Fit the pipeline to samples
____

# Calculate the cluster labels: labels
labels = ____

# Create a DataFrame with labels and species as columns: df
df = ____

# Create crosstab: ct
ct = ____

# Display ct
print(ct)
Editar y ejecutar código