MulaiMulai sekarang secara gratis

Mengelompokkan saham menggunakan KMeans

Dalam latihan ini, Anda akan mengelompokkan perusahaan berdasarkan pergerakan harga saham harian mereka (yaitu selisih dolar antara harga penutupan dan pembukaan untuk setiap hari perdagangan). Anda diberikan array NumPy movements berisi pergerakan harga harian dari 2010 hingga 2015 (diperoleh dari Yahoo! Finance), di mana setiap baris merepresentasikan sebuah perusahaan, dan setiap kolom merepresentasikan satu hari perdagangan.

Beberapa saham lebih mahal daripada yang lain. Untuk mengatasinya, sertakan Normalizer di awal pipeline Anda. Normalizer akan secara terpisah mentransformasikan harga saham setiap perusahaan ke skala relatif sebelum proses pengelompokan dimulai.

Perhatikan bahwa Normalizer() berbeda dengan StandardScaler(), yang Anda gunakan pada latihan sebelumnya. Jika StandardScaler() menstandarkan fitur (seperti fitur pada data ikan di latihan sebelumnya) dengan menghilangkan rata-rata dan menskalakan ke varians satuan, Normalizer() menskalakan ulang setiap sampel - di sini, harga saham tiap perusahaan - secara independen dari yang lain.

KMeans dan make_pipeline sudah diimpor untuk Anda.

Latihan ini adalah bagian dari kursus

Unsupervised Learning in Python

Lihat Kursus

Petunjuk latihan

  • Impor Normalizer dari sklearn.preprocessing.
  • Buat sebuah instans Normalizer bernama normalizer.
  • Buat sebuah instans KMeans bernama kmeans dengan 10 klaster.
  • Dengan menggunakan make_pipeline(), buat sebuah pipeline bernama pipeline yang merangkai normalizer dan kmeans.
  • Latih pipeline pada array movements.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import Normalizer
____

# Create a normalizer: normalizer
normalizer = ____

# Create a KMeans model with 10 clusters: kmeans
kmeans = ____

# Make a pipeline chaining normalizer and kmeans: pipeline
pipeline = ____

# Fit pipeline to the daily price movements
____
Edit dan Jalankan Kode