BaşlayınÜcretsiz Başlayın

Tutarlı sentetik veri kümesi

Şirketlerin sentetik veriyi kullandığı senaryolardan biri, yapay zekâ ve Machine Learning modellerini eğitmektir. Gerçek dünya verisini toplamak bazen maliyetli ya da erişmesi zor olabilir. Eğitim verisi çok dengesiz olduğunda (örneğin örneklerin %90’ından fazlası tek bir sınıfa aitse), sentetik veri üretimi doğru Machine Learning modelleri kurmaya yardımcı olabilir.

Bu egzersizde, Faker kullanarak bir mobil uygulama puanlama veri kümesi oluşturacaksın.

Başlangıç DataFrame’i ratings olarak yüklendi ve iki sütun içeriyor: rating ve gender. Senin için bir Faker() üreticisi de fake_data adıyla önceden başlatıldı.

Bu egzersiz

Python ile Veri Gizliliği ve Anonimleştirme

kursunun bir parçasıdır
Kursu Görüntüle

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Generate a name according to the gender that will be unique in the dataset
ratings['name'] = [____ if x == "Female" 
                   else ____
                   for x in ratings['gender']] 
Kodu Düzenle ve Çalıştır