1. Обучение
  2. /
  3. Курса
  4. /
  5. Обучение без учителя на Python

Connected

упражнение

Масштабирование данных о рыбах для кластеризации

Вам дан массив samples с измерениями рыб. Каждая строка соответствует одной особи. Такие характеристики, как вес в граммах, длина в сантиметрах и процентное соотношение высоты к длине, имеют очень разные масштабы. Чтобы кластеризация была эффективной, необходимо сначала стандартизировать эти признаки. В этом упражнении вы построите конвейер для стандартизации и кластеризации данных.

Данные об измерениях рыб взяты из Journal of Statistics Education.

Инструкции

100 XP
  • Импортируйте:
    • make_pipeline из sklearn.pipeline.
    • StandardScaler из sklearn.preprocessing.
    • KMeans из sklearn.cluster.
  • Создайте экземпляр StandardScaler с именем scaler.
  • Создайте экземпляр KMeans с 4 кластерами и назовите его kmeans.
  • Создайте конвейер с именем pipeline, объединив в нём scaler и kmeans. Для этого передайте их в качестве аргументов функции make_pipeline().