1. Обучение
  2. /
  3. Курса
  4. /
  5. Обучение без учителя на Python

Connected

упражнение

Первая главная компонента

Первая главная компонента данных — это направление, в котором данные варьируются больше всего. В этом упражнении вам нужно применить PCA, чтобы найти первую главную компоненту по измерениям длины и ширины образцов зерна, а затем отобразить её в виде стрелки на диаграмме рассеяния.

Массив grains содержит значения длины и ширины образцов зерна. PyPlot (plt) и PCA уже импортированы.

Инструкции

100 XP
  • Постройте диаграмму рассеяния по измерениям зерна. Этот шаг уже выполнен за вас.
  • Создайте экземпляр класса PCA с именем model.
  • Обучите модель на данных grains.
  • Извлеките координаты среднего значения данных с помощью атрибута .mean_ объекта model.
  • Получите первую главную компоненту объекта model, используя атрибут .components_[0,:].
  • Отобразите первую главную компоненту в виде стрелки на диаграмме рассеяния с помощью функции plt.arrow(). Укажите первые два аргумента — mean[0] и mean[1].