IniziaInizia gratis

Voto di maggioranza su più fonti di dati

Il tuo team sta sviluppando un modello di AI per generare automaticamente report di controllo qualità (QC) per smartphone. A questo scopo, avete raccolto dati di preferenza da tre diverse fonti di controllo qualità: un "Automated Vision System", un "Human Inspector" e "Customer Feedback". Ognuna ha etichettato coppie di testi come 'chosen' e 'rejected'. Ogni coppia ha un 'id' univoco e ogni voce mostra una revisione QC preferita.

quality_df è un DataFrame combinato caricato con pandas. Contiene dati provenienti dalle tre diverse fonti. Inoltre, la classe Counter è stata preimportata dal modulo collections.

Questo esercizio fa parte del corso

Reinforcement Learning from Human Feedback (RLHF)

Visualizza il corso

Istruzioni dell'esercizio

  • Conta le occorrenze di ciascuna coppia (chosen, rejected) nella funzione di voto.
  • Trova la coppia (chosen, rejected) con il conteggio di voti più alto.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

def majority_vote(df):
  	# Count occurrences of each (chosen, rejected) pair
    votes = ____
    # Find the (chosen, rejected) pair with the highest vote count
    winner = ____
    return winner

final_preferences = quality_df.groupby(['id']).apply(majority_vote)

print(final_preferences)
Modifica ed esegui il codice