BaşlayınÜcretsiz Başlayın

Birden çok veri kaynağında çoğunluk oylaması

Ekibin, akıllı telefon kalite kontrol (QC) raporlarını otomatik olarak oluşturan bir AI modeli geliştiriyor. Bu amaçla, üç farklı kalite kontrol kaynağından — "Automated Vision System", "Human Inspector" ve "Customer Feedback" — tercih verisi topladınız. Her biri, eşleştirilmiş metin örneklerini 'chosen' ve 'rejected' olarak etiketledi. Her çiftin benzersiz bir 'id'si var ve her kayıt tercih edilen bir QC incelemesini gösteriyor.

quality_df, üç farklı veri kaynağından gelen verileri içeren ve pandas kullanılarak yüklenmiş birleşik bir DataFrame'dir. Ayrıca, collections modülünden Counter sınıfı önceden içe aktarılmıştır.

Bu egzersiz

İnsan Geri Bildiriminden Pekiştirmeli Öğrenme (RLHF)

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • vote fonksiyonu içinde her (chosen, rejected) çiftinin görülme sayısını say.
  • En yüksek oy sayısına sahip (chosen, rejected) çiftini bul.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

def majority_vote(df):
  	# Count occurrences of each (chosen, rejected) pair
    votes = ____
    # Find the (chosen, rejected) pair with the highest vote count
    winner = ____
    return winner

final_preferences = quality_df.groupby(['id']).apply(majority_vote)

print(final_preferences)
Kodu Düzenle ve Çalıştır