KMeans ile hisseleri kümeleme
Bu egzersizde, şirketleri günlük hisse senedi fiyat hareketlerine göre (her işlem gününde kapanış ile açılış fiyatı arasındaki dolar farkı) kümleyeceksin. Sana 2010-2015 arasındaki günlük fiyat hareketlerini içeren bir NumPy dizisi movements veriliyor (Yahoo! Finance'ten alınmıştır); her satır bir şirkete, her sütun bir işlem gününe karşılık gelir.
Bazı hisseler diğerlerinden daha pahalı olabilir. Bunu hesaba katmak için, ardışık düzeninin (pipeline) başına bir Normalizer ekle. Normalizer, kümeleme başlamadan önce her şirketin hisse fiyatlarını ayrı ayrı göreli bir ölçeğe dönüştürecek.
Normalizer()ın, önceki egzersizde kullandığın StandardScaler()dan farklı olduğunu unutma. StandardScaler() özellikleri (örneğin, önceki egzersizdeki balık verisinin özellikleri) ortalamayı çıkarıp birim varyansa ölçekleyerek standartlaştırırken, Normalizer() her bir örneği - burada her şirketin hisse fiyatını - diğerlerinden bağımsız olarak yeniden ölçekler.
KMeans ve make_pipeline senin için zaten içe aktarıldı.
Bu egzersiz
Python'da Unsupervised Learning
kursunun bir parçasıdırEgzersiz talimatları
sklearn.preprocessingmodülündenNormalizerı içe aktar.normalizeradlı birNormalizerörneği oluştur.10kümeli birKMeansörneği oluştur ve adınıkmeanskoy.make_pipeline()kullanaraknormalizervekmeansögelerini zincirleyenpipelineadlı bir ardışık düzen oluştur.- Ardışık düzeni
movementsdizisine uydur (fit et).
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Import Normalizer
____
# Create a normalizer: normalizer
normalizer = ____
# Create a KMeans model with 10 clusters: kmeans
kmeans = ____
# Make a pipeline chaining normalizer and kmeans: pipeline
pipeline = ____
# Fit pipeline to the daily price movements
____