BaşlayınÜcretsiz Başlayın

Sınıflandırma için veri kümeleri oluşturma

İstenen tüm kriter kombinasyonlarını karşılayan gerçek bir veri kümesi bulmak zor olabilir ve toplansa bile gizlilik riski taşıyabilir. Çözüm olarak, gerçek veri kümelerine iyi yaklaşımlar sunan veri kümesi üreticilerini kullanabilirsin.

Bu egzersizde, 3 sınıflı bir sınıflandırma problemi için büyük bir veri kümesi oluşturacaksın. Üretilen veriyi saçılım grafiği olarak kolayca görselleştirebilmen için plot_data_points() adlı özel bir fonksiyon sağlandı.

Bu egzersiz

Python ile Veri Gizliliği ve Anonimleştirme

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Sınıflandırma veri kümeleri oluşturmak için sklearn.datasets içinden ilgili fonksiyonu içe aktar.
  • 4 özellikli 5000 örnek, her sınıf için 1 küme, 3 sınıf ve 2 sınıf ayrımı ile veri üret.
  • Oluşturulan verinin şeklini yazdır.
  • Ortaya çıkan saçılım grafiğini gör.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Import the function for generating classification datasets
from sklearn.datasets import ____

# Generate 5000 samples with 4 features, 1 cluster per class, 3 classes, and class separation of 2
x, y = ____

# Inspect the generated data shape
print(____)

# Inspect the resulting data points in a 2 dimensional scatter plot
plot_data_points(x, y)
Kodu Düzenle ve Çalıştır