BaşlayınÜcretsiz Başlayın

Aynı olasılıksal dağılıma sahip veri kümeleri

Yapay verinin amacı, mümkün olduğunca gerçekçi bir veri kümesi üretmek ve bunu kişisel bilgilerin kritik kısımlarını riske atmadan yapmaktır. Örneğin, Deloitte Consulting’te bir ekip, bir Machine Learning modeli için eğitim verisinin %80’ini veriyi sentezleyerek üretti. Ortaya çıkan modelin doğruluğu, gerçek verilerle eğitilen bir modelinkine benzerdi.

Bu egzersizde, p olarak yüklenen bir olasılıksal dağılıma uyan, sıfırdan bir yapay veri kümesi oluşturmak için Faker kullanacaksın.

Faker üreticisi fake_data zaten başlatıldı ve numpy np olarak içe aktarıldı.

Bu egzersiz

Python ile Veri Gizliliği ve Anonimleştirme

kursunun bir parçasıdır
Kursu Görüntüle

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Obtain or specify the probabilities
p = (0.46, 0.26, 0.16, 0.1, 0.02)

# Generate 5 random cities 
cities = ____

# See the generated cities
print(cities)
Kodu Düzenle ve Çalıştır