BaşlayınÜcretsiz Başlayın

Pratik konular: ölçekleme

Videodan hatırlayacağın üzere, gerçek verilerde değişkenlerin dağılımları farklıysa özelliklerin ölçeklenmesi gerekebilir. Bu bölümde şimdiye kadar ölçeklemeye ihtiyaç duymayan sentetik verilerle çalıştın.

Bu egzersizde, ilk bölümde tanıtılan pokemon veri kümesine, yani “gerçek” verilere geri dönüyorsun. Her özelliğin dağılımını (ortalama ve standart sapma) inceleyecek, veriyi buna göre ölçekleyecek ve ardından complete linkage yöntemiyle hiyerarşik bir kümeleme modeli üreteceksin.

Bu egzersiz

R ile Denetimsiz Öğrenme

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

Veri çalışma alanındaki pokemon nesnesinde saklı.

  • colMeans() fonksiyonunu kullanarak pokemon içindeki her değişkenin ortalamasını gözlemle.
  • apply() ve sd() fonksiyonlarını kullanarak her değişkenin standart sapmasını gözlemle. Değişkenler matrisinin sütunları olduğundan, apply() fonksiyonunda MARGIN argümanını 2 olarak belirtmeyi unutma.
  • scale() fonksiyonunu kullanarak pokemon verisini ölçekle ve sonucu pokemon.scaled içinde sakla.
  • complete linkage yöntemiyle pokemon.scaled verisinin hiyerarşik kümeleme modelini oluştur. method argümanını elle belirt ve sonucu hclust.pokemon içinde sakla.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# View column means


# View column standard deviations


# Scale the data


# Create hierarchical clustering model: hclust.pokemon
Kodu Düzenle ve Çalıştır