Tutarlı sentetik veri kümesi
Şirketlerin sentetik veriyi kullandığı senaryolardan biri, yapay zekâ ve Machine Learning modellerini eğitmektir. Gerçek dünya verisini toplamak bazen maliyetli ya da erişmesi zor olabilir. Eğitim verisi çok dengesiz olduğunda (örneğin örneklerin %90’ından fazlası tek bir sınıfa aitse), sentetik veri üretimi doğru Machine Learning modelleri kurmaya yardımcı olabilir.
Bu egzersizde, Faker kullanarak bir mobil uygulama puanlama veri kümesi oluşturacaksın.
Başlangıç DataFrame’i ratings olarak yüklendi ve iki sütun içeriyor: rating ve gender. Senin için bir Faker() üreticisi de fake_data adıyla önceden başlatıldı.
Bu egzersiz, kursun bir parçasıdır
Python ile Veri Gizliliği ve Anonimleştirme
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Generate a name according to the gender that will be unique in the dataset
ratings['name'] = [____ if x == "Female"
else ____
for x in ratings['gender']]