Pratik konular: ölçekleme
Videodan hatırlayacağın üzere, gerçek verilerde değişkenlerin dağılımları farklıysa özelliklerin ölçeklenmesi gerekebilir. Bu bölümde şimdiye kadar ölçeklemeye ihtiyaç duymayan sentetik verilerle çalıştın.
Bu egzersizde, ilk bölümde tanıtılan pokemon veri kümesine, yani “gerçek” verilere geri dönüyorsun. Her özelliğin dağılımını (ortalama ve standart sapma) inceleyecek, veriyi buna göre ölçekleyecek ve ardından complete linkage yöntemiyle hiyerarşik bir kümeleme modeli üreteceksin.
Bu egzersiz
R ile Denetimsiz Öğrenme
kursunun bir parçasıdırEgzersiz talimatları
Veri çalışma alanındaki pokemon nesnesinde saklı.
colMeans()fonksiyonunu kullanarakpokemoniçindeki her değişkenin ortalamasını gözlemle.apply()vesd()fonksiyonlarını kullanarak her değişkenin standart sapmasını gözlemle. Değişkenler matrisinin sütunları olduğundan,apply()fonksiyonundaMARGINargümanını 2 olarak belirtmeyi unutma.scale()fonksiyonunu kullanarakpokemonverisini ölçekle ve sonucupokemon.scalediçinde sakla.- complete linkage yöntemiyle
pokemon.scaledverisinin hiyerarşik kümeleme modelini oluştur.methodargümanını elle belirt ve sonucuhclust.pokemoniçinde sakla.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# View column means
# View column standard deviations
# Scale the data
# Create hierarchical clustering model: hclust.pokemon