1. Learn
  2. /
  3. Курси
  4. /
  5. Наглядове навчання в Python

Connected

вправа

Кластеризація акцій за допомогою KMeans

У цій вправі ви кластеризуватимете компанії за їхніми щоденними змінами цін на акції (тобто різницею в доларах між ціною закриття та відкриття кожного біржового дня). Вам надано масив NumPy movements зі щоденними змінами цін за 2010–2015 роки (отримано з Yahoo! Finance), де кожен рядок відповідає компанії, а кожен стовпець — біржовому дню.

Деякі акції дорожчі за інші. Щоб це врахувати, додайте Normalizer на початку вашого конвеєра. Normalizer окремо перетворить цінові ряди кожної компанії до відносної шкали перед початком кластеризації.

Зверніть увагу, що Normalizer() відрізняється від StandardScaler(), який ви використовували у попередній вправі. Якщо StandardScaler() стандартизує ознаки (як-от ознаки даних про рибу з попередньої вправи), віднімаючи середнє та масштабує до одиничної дисперсії, то Normalizer() перевмасштабує кожен зразок — тут, кожної компанії ряд цін — незалежно від інших.

KMeans і make_pipeline уже імпортовано для вас.

Інструкції

100 XP
  • Імпортуйте Normalizer з sklearn.preprocessing.
  • Створіть екземпляр Normalizer під назвою normalizer.
  • Створіть екземпляр KMeans під назвою kmeans з 10 кластерами.
  • За допомогою make_pipeline() створіть конвеєр pipeline, який послідовно виконує normalizer та kmeans.
  • Навчіть конвеєр на масиві movements методом .fit().