MulaiMulai sekarang secara gratis

Voting mayoritas pada beberapa sumber data

Tim Anda sedang mengembangkan model AI untuk secara otomatis menghasilkan laporan quality control (QC) smartphone. Untuk itu, Anda telah mengumpulkan data preferensi dari tiga sumber quality control yang berbeda — "Automated Vision System", "Human Inspector", dan "Customer Feedback". Masing-masing telah memberi label pasangan cuplikan teks sebagai 'chosen' dan 'rejected'. Setiap pasangan memiliki 'id' unik, dan setiap entri menampilkan ulasan QC yang dipilih.

quality_df adalah DataFrame gabungan yang dimuat menggunakan pandas. Himpunan data ini memuat data dari ketiga sumber tersebut. Selain itu, kelas Counter telah diimpor sebelumnya dari modul collections.

Latihan ini adalah bagian dari kursus

Reinforcement Learning from Human Feedback (RLHF)

Lihat Kursus

Petunjuk latihan

  • Hitung frekuensi kemunculan setiap pasangan (chosen, rejected) dalam fungsi vote.
  • Temukan pasangan (chosen, rejected) dengan jumlah suara tertinggi.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

def majority_vote(df):
  	# Count occurrences of each (chosen, rejected) pair
    votes = ____
    # Find the (chosen, rejected) pair with the highest vote count
    winner = ____
    return winner

final_preferences = quality_df.groupby(['id']).apply(majority_vote)

print(final_preferences)
Edit dan Jalankan Kode