K-means kümeleme: ilk egzersiz

Bu egzersiz, bir veri kümesi üzerinde k-means kümelemenin kullanımına alışmanı sağlayacak. Comic Con veri kümesini kullanalım ve k-means kümelemenin onda nasıl çalıştığını görelim.

K-means kümelemenin iki adımını hatırla:

kmeans() fonksiyonu ile küme merkezlerini tanımla. İki zorunlu argümanı vardır: gözlemler ve küme sayısı.
vq() fonksiyonu ile küme etiketlerini ata. İki zorunlu argümanı vardır: gözlemler ve küme merkezleri.

Veriler bir pandas DataFrame’i olan comic_con içinde saklanıyor. x_scaled ve y_scaled, belirli bir anda insanların standartlaştırılmış X ve Y koordinatlarının sütun adlarıdır.

Bu egzersiz, kursun bir parçasıdır

Python ile Kümeleme Analizi

Kursa Göz Atın

Egzersiz talimatları

SciPy içinde kmeans ve vq fonksiyonlarını içe aktar.
kmeans() fonksiyonunu iki küme ile kullanarak küme merkezlerini üret.
Bu küme merkezlerini kullanarak küme etiketleri oluştur.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Import the kmeans and vq functions
from ____.cluster.vq import ____, ____

# Generate cluster centers
cluster_centers, distortion = ____

# Assign cluster labels
comic_con['cluster_labels'], distortion_list = ____

# Plot clusters
sns.scatterplot(x='x_scaled', y='y_scaled', 
                hue='cluster_labels', data = comic_con)
plt.show()

Kodu Düzenle ve Çalıştır

Bu egzersiz, kursun bir parçasıdır

Python ile Kümeleme Analizi

IntermediárioNível de habilidade

4.8+

Kursa Ücretsiz Başla

Haber makalelerini sınıflandırmaya hazır olmadan önce, kümelemenin temellerine giriş yapman gerekiyor. Bu bölümde, gözetimsiz öğrenme adı verilen bir Machine Learning algoritmaları sınıfıyla tanışacak, ardından en popüler gözetimsiz öğrenme yöntemlerinden biri olan kümelemeyi öğreneceksin. İki yaygın kümeleme tekniğini — hiyerarşik kümeleme ve k-means kümelemeyi — öğreneceksin. Bölüm, verileri kümelemeye başlamadan önce yapılacak temel ön işleme adımlarıyla sona erer.

Exercise 1: Unsupervised learning: temel bilgiler Exercise 2: Gerçek dünyada unsupervised learning Exercise 3: Pokémon gözlemleri Exercise 4: Kümeleme analizinin temelleri Exercise 5: Pokémon görümleri: hiyerarşik kümeleme Exercise 6: Pokémon gözlemleri: k-means kümeleme Exercise 7: Kümeleme analizi için veri hazırlığı Exercise 8: Temel liste verisini normalize et Exercise 9: Normalize edilmiş veriyi görselleştir Exercise 10: Küçük sayıların normalizasyonu Exercise 11: FIFA 18: Verileri normalize et

Bu bölüm, popüler bir kümeleme algoritması olan hiyerarşik kümelemeye ve bunun SciPy ile uygulanmasına odaklanır. Hiyerarşik kümelemeyi gerçekleştirme adımlarına ek olarak, verilerinde kaç küme olduğunu belirlemene yardımcı olacak önemli bir soruyu yanıtlamayı amaçlar. Bölüm, hiyerarşik kümelemenin sınırlamaları ve bu yöntemi kullanırken dikkat edilmesi gereken noktalarla ilgili bir tartışma ile sona erer.

Exercise 1: Hiyerarşik kümelemenin temelleri Exercise 2: Hiyerarşik kümeleme: ward yöntemi Exercise 3: Hiyerarşik kümeleme: single yöntemi Exercise 4: Hiyerarşik kümeleme: complete yöntemi Exercise 5: Kümeleri görselleştir Exercise 6: matplotlib ile kümeleri görselleştir Exercise 7: seaborn ile kümeleri görselleştir Exercise 8: Kaç küme var?Exercise 9: Bir dendrogram oluştur Exercise 10: Comic Con verilerinde kaç küme var?Exercise 11: Hiyerarşik kümelemenin sınırlamaları Exercise 12: Hiyerarşik kümelemeyi çalıştırmanın süresini ölçme Exercise 13: FIFA 18: defans oyuncularını keşfetme

Bu bölüm, farklı bir kümeleme algoritması olan k-means kümelemeyi ve onun SciPy ile uygulanmasını tanıtır. K-means kümeleme, önceki bölümde tartışılan hiyerarşik kümelemenin en büyük dezavantajını aşar. Dendrogramlar yalnızca hiyerarşik kümelemede kullanıldığından, bu bölüm k-means kümelemeyi çalıştırmadan önce küme sayısını bulmanın bir yöntemini ele alır. Bölüm, k-means kümelemenin sınırlamaları ve bu algoritmayı kullanırken dikkat edilmesi gerekenler üzerine bir tartışma ile sona erer.

Exercise 1: k-means kümelemenin temelleri Exercise 2: K-means kümeleme: ilk egzersiz

Geçerli egzersiz

Exercise 3: k-means kümelemenin çalışma süresi Exercise 4: Kaç küme?Exercise 5: Belirgin kümelerde dirsek yöntemi Exercise 6: Uniform verilerde dirsek yöntemi Exercise 7: k-means kümelemenin sınırlamaları Exercise 8: Tohumların farklı kümeler üzerindeki etkisi Exercise 9: Tekdüze kümeleme desenleri Exercise 10: FIFA 18: savunmacılara yeniden bakalım

Artık en popüler iki kümeleme tekniğine aşina olduğuna göre, bu bölüm bu bilgiyi gerçek dünya problemlerine uygulamana yardımcı olur. Önce bir görselde baskın renkleri bulma sürecini ele alır, ardından girişte bahsedilen probleme — haber makalelerinin kümelenmesine — geçer. Bölüm, çok değişkenli kümeleme üzerine bir tartışmayla sona erer; bu durum tüm verileri görselleştirmeyi zorlaştırır.

Exercise 1: Görüntülerde baskın renkler Exercise 2: Görüntüden RGB değerlerini çıkar Exercise 3: Kaç baskın renk var?Exercise 4: Baskın renkleri görüntüle Exercise 5: Belge kümeleme Exercise 6: Film özetlerinin TF-IDF'i Exercise 7: Film kümelerindeki en iyi terimler Exercise 8: Birden çok özellik ile kümeleme Exercise 9: Çok sayıda özellikle kümeleme Exercise 10: Kümelerde temel kontroller Exercise 11: FIFA 18: eksiksiz bir oyuncuyu ne yapar?Exercise 12: Hoşça kal!