Sınıflandırma için veri kümeleri oluşturma
İstenen tüm kriter kombinasyonlarını karşılayan gerçek bir veri kümesi bulmak zor olabilir ve toplansa bile gizlilik riski taşıyabilir. Çözüm olarak, gerçek veri kümelerine iyi yaklaşımlar sunan veri kümesi üreticilerini kullanabilirsin.
Bu egzersizde, 3 sınıflı bir sınıflandırma problemi için büyük bir veri kümesi oluşturacaksın. Üretilen veriyi saçılım grafiği olarak kolayca görselleştirebilmen için plot_data_points() adlı özel bir fonksiyon sağlandı.
Bu egzersiz
Python ile Veri Gizliliği ve Anonimleştirme
kursunun bir parçasıdırEgzersiz talimatları
- Sınıflandırma veri kümeleri oluşturmak için
sklearn.datasetsiçinden ilgili fonksiyonu içe aktar. 4özellikli5000örnek, her sınıf için1küme,3sınıf ve2sınıf ayrımı ile veri üret.- Oluşturulan verinin şeklini yazdır.
- Ortaya çıkan saçılım grafiğini gör.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Import the function for generating classification datasets
from sklearn.datasets import ____
# Generate 5000 samples with 4 features, 1 cluster per class, 3 classes, and class separation of 2
x, y = ____
# Inspect the generated data shape
print(____)
# Inspect the resulting data points in a 2 dimensional scatter plot
plot_data_points(x, y)