Aynı olasılıksal dağılıma sahip veri kümeleri
Yapay verinin amacı, mümkün olduğunca gerçekçi bir veri kümesi üretmek ve bunu kişisel bilgilerin kritik kısımlarını riske atmadan yapmaktır. Örneğin, Deloitte Consulting’te bir ekip, bir Machine Learning modeli için eğitim verisinin %80’ini veriyi sentezleyerek üretti. Ortaya çıkan modelin doğruluğu, gerçek verilerle eğitilen bir modelinkine benzerdi.
Bu egzersizde, p olarak yüklenen bir olasılıksal dağılıma uyan, sıfırdan bir yapay veri kümesi oluşturmak için Faker kullanacaksın.
Faker üreticisi fake_data zaten başlatıldı ve numpy np olarak içe aktarıldı.
Bu egzersiz, kursun bir parçasıdır
Python ile Veri Gizliliği ve Anonimleştirme
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Obtain or specify the probabilities
p = (0.46, 0.26, 0.16, 0.1, 0.02)
# Generate 5 random cities
cities = ____
# See the generated cities
print(cities)