Pratik konular: ölçekleme

Videodan hatırlayacağın üzere, gerçek verilerde değişkenlerin dağılımları farklıysa özelliklerin ölçeklenmesi gerekebilir. Bu bölümde şimdiye kadar ölçeklemeye ihtiyaç duymayan sentetik verilerle çalıştın.

Bu egzersizde, ilk bölümde tanıtılan pokemon veri kümesine, yani “gerçek” verilere geri dönüyorsun. Her özelliğin dağılımını (ortalama ve standart sapma) inceleyecek, veriyi buna göre ölçekleyecek ve ardından complete linkage yöntemiyle hiyerarşik bir kümeleme modeli üreteceksin.

Bu egzersiz, kursun bir parçasıdır

R ile Denetimsiz Öğrenme

Kursa Göz Atın

Egzersiz talimatları

Veri çalışma alanındaki pokemon nesnesinde saklı.

colMeans() fonksiyonunu kullanarak pokemon içindeki her değişkenin ortalamasını gözlemle.
apply() ve sd() fonksiyonlarını kullanarak her değişkenin standart sapmasını gözlemle. Değişkenler matrisinin sütunları olduğundan, apply() fonksiyonunda MARGIN argümanını 2 olarak belirtmeyi unutma.
scale() fonksiyonunu kullanarak pokemon verisini ölçekle ve sonucu pokemon.scaled içinde sakla.
complete linkage yöntemiyle pokemon.scaled verisinin hiyerarşik kümeleme modelini oluştur. method argümanını elle belirt ve sonucu hclust.pokemon içinde sakla.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# View column means


# View column standard deviations


# Scale the data


# Create hierarchical clustering model: hclust.pokemon

Kodu Düzenle ve Çalıştır