Birden çok veri kaynağında çoğunluk oylaması
Ekibin, akıllı telefon kalite kontrol (QC) raporlarını otomatik olarak oluşturan bir AI modeli geliştiriyor. Bu amaçla, üç farklı kalite kontrol kaynağından — "Automated Vision System", "Human Inspector" ve "Customer Feedback" — tercih verisi topladınız. Her biri, eşleştirilmiş metin örneklerini 'chosen' ve 'rejected' olarak etiketledi. Her çiftin benzersiz bir 'id'si var ve her kayıt tercih edilen bir QC incelemesini gösteriyor.
quality_df, üç farklı veri kaynağından gelen verileri içeren ve pandas kullanılarak yüklenmiş birleşik bir DataFrame'dir. Ayrıca, collections modülünden Counter sınıfı önceden içe aktarılmıştır.
Bu egzersiz
İnsan Geri Bildiriminden Pekiştirmeli Öğrenme (RLHF)
kursunun bir parçasıdırEgzersiz talimatları
- vote fonksiyonu içinde her (chosen, rejected) çiftinin görülme sayısını say.
- En yüksek oy sayısına sahip (chosen, rejected) çiftini bul.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
def majority_vote(df):
# Count occurrences of each (chosen, rejected) pair
votes = ____
# Find the (chosen, rejected) pair with the highest vote count
winner = ____
return winner
final_preferences = quality_df.groupby(['id']).apply(majority_vote)
print(final_preferences)