BaşlayınÜcretsiz başlayın

Aynı olasılıksal dağılıma sahip veri kümeleri

Yapay verinin amacı, mümkün olduğunca gerçekçi bir veri kümesi üretmek ve bunu kişisel bilgilerin kritik kısımlarını riske atmadan yapmaktır. Örneğin, Deloitte Consulting’te bir ekip, bir Machine Learning modeli için eğitim verisinin %80’ini veriyi sentezleyerek üretti. Ortaya çıkan modelin doğruluğu, gerçek verilerle eğitilen bir modelinkine benzerdi.

Bu egzersizde, p olarak yüklenen bir olasılıksal dağılıma uyan, sıfırdan bir yapay veri kümesi oluşturmak için Faker kullanacaksın.

Faker üreticisi fake_data zaten başlatıldı ve numpy np olarak içe aktarıldı.

Bu egzersiz, kursun bir parçasıdır

Python ile Veri Gizliliği ve Anonimleştirme

Kursa Göz Atın

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Obtain or specify the probabilities
p = (0.46, 0.26, 0.16, 0.1, 0.02)

# Generate 5 random cities 
cities = ____

# See the generated cities
print(cities)
Kodu Düzenle ve Çalıştır