1. Learn
  2. /
  3. Курси
  4. /
  5. Наглядове навчання в Python

Connected

вправа

Масштабування даних про риб для кластеризації

Надається масив samples з вимірами риб. Кожний рядок відповідає окремій рибі. Виміри, як-от вага в грамах, довжина в сантиметрах і відсоткове співвідношення висоти до довжини, мають дуже різні шкали. Щоб ефективно кластеризувати ці дані, спершу потрібно стандартизувати ці ознаки. У цій вправі ви побудуєте конвеєр для стандартизації та кластеризації даних.

Ці дані вимірювань риб узято з Journal of Statistics Education.

Інструкції

100 XP
  • Імпортуйте:
    • make_pipeline з sklearn.pipeline.
    • StandardScaler з sklearn.preprocessing.
    • KMeans з sklearn.cluster.
  • Створіть екземпляр StandardScaler з назвою scaler.
  • Створіть екземпляр KMeans з 4 кластерами з назвою kmeans.
  • Створіть конвеєр з назвою pipeline, який послідовно з'єднує scaler і kmeans. Для цього просто передайте їх як аргументи до make_pipeline().