Aynı olasılıksal dağılıma sahip veri kümeleri
Yapay verinin amacı, mümkün olduğunca gerçekçi bir veri kümesi üretmek ve bunu kişisel bilgilerin kritik kısımlarını riske atmadan yapmaktır. Örneğin, Deloitte Consulting’te bir ekip, bir Machine Learning modeli için eğitim verisinin %80’ini veriyi sentezleyerek üretti. Ortaya çıkan modelin doğruluğu, gerçek verilerle eğitilen bir modelinkine benzerdi.
Bu egzersizde, p olarak yüklenen bir olasılıksal dağılıma uyan, sıfırdan bir yapay veri kümesi oluşturmak için Faker kullanacaksın.
Faker üreticisi fake_data zaten başlatıldı ve numpy np olarak içe aktarıldı.
Bu egzersiz
Python ile Veri Gizliliği ve Anonimleştirme
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Obtain or specify the probabilities
p = (0.46, 0.26, 0.16, 0.1, 0.02)
# Generate 5 random cities
cities = ____
# See the generated cities
print(cities)