Votación por mayoría con múltiples fuentes de datos
Tu equipo está desarrollando un modelo de IA para generar automáticamente informes de control de calidad (QC) de smartphones. Para ello, has recopilado datos de preferencias de tres fuentes de control de calidad diferentes: un "Automated Vision System", un "Human Inspector" y "Customer Feedback". Cada una ha etiquetado parejas de textos como 'chosen' y 'rejected'. Cada pareja tiene un 'id' único y cada entrada muestra una revisión de QC preferida.
quality_df es un DataFrame combinado cargado con pandas. Contiene datos de las tres fuentes. Además, la clase Counter se ha preimportado del módulo collections.
Este ejercicio forma parte del curso
Reinforcement Learning from Human Feedback (RLHF)
Instrucciones del ejercicio
- Cuenta las ocurrencias de cada pareja (chosen, rejected) en la función de voto.
- Encuentra la pareja (chosen, rejected) con el mayor número de votos.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
def majority_vote(df):
# Count occurrences of each (chosen, rejected) pair
votes = ____
# Find the (chosen, rejected) pair with the highest vote count
winner = ____
return winner
final_preferences = quality_df.groupby(['id']).apply(majority_vote)
print(final_preferences)