Voting mayoritas pada beberapa sumber data
Tim Anda sedang mengembangkan model AI untuk secara otomatis menghasilkan laporan quality control (QC) smartphone. Untuk itu, Anda telah mengumpulkan data preferensi dari tiga sumber quality control yang berbeda — "Automated Vision System", "Human Inspector", dan "Customer Feedback". Masing-masing telah memberi label pasangan cuplikan teks sebagai 'chosen' dan 'rejected'. Setiap pasangan memiliki 'id' unik, dan setiap entri menampilkan ulasan QC yang dipilih.
quality_df adalah DataFrame gabungan yang dimuat menggunakan pandas. Himpunan data ini memuat data dari ketiga sumber tersebut. Selain itu, kelas Counter telah diimpor sebelumnya dari modul collections.
Latihan ini merupakan bagian dari kursus
Reinforcement Learning from Human Feedback (RLHF)
Instruksi latihan
- Hitung frekuensi kemunculan setiap pasangan (chosen, rejected) dalam fungsi vote.
- Temukan pasangan (chosen, rejected) dengan jumlah suara tertinggi.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
def majority_vote(df):
# Count occurrences of each (chosen, rejected) pair
votes = ____
# Find the (chosen, rejected) pair with the highest vote count
winner = ____
return winner
final_preferences = quality_df.groupby(['id']).apply(majority_vote)
print(final_preferences)