BaşlayınÜcretsiz Başlayın

Kümeleme için veri kümeleri oluşturma

Sentetik veriler tamamen yasal olup dünya genelindeki gizlilik yasa ve düzenlemelerinin tüm gerekliliklerini karşılar. Ham veriye gizlilik odaklı geçerli bir alternatiftir. make_blobs() fonksiyonu, Gauss (veya normal) dağılıma sahip veri noktaları üretmek için kullanılabilir.

Bu egzersizde 15000 örnekten oluşan bir veri kümesi oluşturacaksın.

numpy zaten np olarak içe aktarıldı ve bu egzersiz için özel plot_data_points() fonksiyonu tekrar sağlandı.

Bu egzersiz

Python ile Veri Gizliliği ve Anonimleştirme

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Kümeleme veri setleri üretmek için datasets modülünden ilgili fonksiyonu içe aktar.
  • 2 özellik, 2 merkez ve 3 küme standart sapması ile 15000 örnekten oluşan bir veri kümesi üret.
  • Ortaya çıkan üretilmiş verinin şeklini yazdır.
  • Ortaya çıkan veri noktalarını iki boyutlu bir saçılım grafiğinde incele.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Import the function from the datasets module for generating clustering datasets
from sklearn.datasets import ____

# Generate a dataset with 15000 rows, 2 features, 2 centers, and a cluster std of 3
x, labels = ____

# Print the shape of the resulting generated data
print(____)

# See the resulting data points in a 2 dimensional scatter plot
plot_data_points(x, labels)
Kodu Düzenle ve Çalıştır