Voting mayoritas pada beberapa sumber data
Tim Anda sedang mengembangkan model AI untuk secara otomatis menghasilkan laporan quality control (QC) smartphone. Untuk itu, Anda telah mengumpulkan data preferensi dari tiga sumber quality control yang berbeda — "Automated Vision System", "Human Inspector", dan "Customer Feedback". Masing-masing telah memberi label pasangan cuplikan teks sebagai 'chosen' dan 'rejected'. Setiap pasangan memiliki 'id' unik, dan setiap entri menampilkan ulasan QC yang dipilih.
quality_df adalah DataFrame gabungan yang dimuat menggunakan pandas. Himpunan data ini memuat data dari ketiga sumber tersebut. Selain itu, kelas Counter telah diimpor sebelumnya dari modul collections.
Latihan ini adalah bagian dari kursus
Reinforcement Learning from Human Feedback (RLHF)
Petunjuk latihan
- Hitung frekuensi kemunculan setiap pasangan (chosen, rejected) dalam fungsi vote.
- Temukan pasangan (chosen, rejected) dengan jumlah suara tertinggi.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
def majority_vote(df):
# Count occurrences of each (chosen, rejected) pair
votes = ____
# Find the (chosen, rejected) pair with the highest vote count
winner = ____
return winner
final_preferences = quality_df.groupby(['id']).apply(majority_vote)
print(final_preferences)