Voto di maggioranza su più fonti di dati
Il tuo team sta sviluppando un modello di AI per generare automaticamente report di controllo qualità (QC) per smartphone. A questo scopo, avete raccolto dati di preferenza da tre diverse fonti di controllo qualità: un "Automated Vision System", un "Human Inspector" e "Customer Feedback". Ognuna ha etichettato coppie di testi come 'chosen' e 'rejected'. Ogni coppia ha un 'id' univoco e ogni voce mostra una revisione QC preferita.
quality_df è un DataFrame combinato caricato con pandas. Contiene dati provenienti dalle tre diverse fonti. Inoltre, la classe Counter è stata preimportata dal modulo collections.
Questo esercizio fa parte del corso
Reinforcement Learning from Human Feedback (RLHF)
Istruzioni dell'esercizio
- Conta le occorrenze di ciascuna coppia (chosen, rejected) nella funzione di voto.
- Trova la coppia (chosen, rejected) con il conteggio di voti più alto.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
def majority_vote(df):
# Count occurrences of each (chosen, rejected) pair
votes = ____
# Find the (chosen, rejected) pair with the highest vote count
winner = ____
return winner
final_preferences = quality_df.groupby(['id']).apply(majority_vote)
print(final_preferences)