ComenzarEmpieza gratis

Votación por mayoría con múltiples fuentes de datos

Tu equipo está desarrollando un modelo de IA para generar automáticamente informes de control de calidad (QC) de smartphones. Para ello, has recopilado datos de preferencias de tres fuentes de control de calidad diferentes: un "Automated Vision System", un "Human Inspector" y "Customer Feedback". Cada una ha etiquetado parejas de textos como 'chosen' y 'rejected'. Cada pareja tiene un 'id' único y cada entrada muestra una revisión de QC preferida.

quality_df es un DataFrame combinado cargado con pandas. Contiene datos de las tres fuentes. Además, la clase Counter se ha preimportado del módulo collections.

Este ejercicio forma parte del curso

Reinforcement Learning from Human Feedback (RLHF)

Ver curso

Instrucciones del ejercicio

  • Cuenta las ocurrencias de cada pareja (chosen, rejected) en la función de voto.
  • Encuentra la pareja (chosen, rejected) con el mayor número de votos.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

def majority_vote(df):
  	# Count occurrences of each (chosen, rejected) pair
    votes = ____
    # Find the (chosen, rejected) pair with the highest vote count
    winner = ____
    return winner

final_preferences = quality_df.groupby(['id']).apply(majority_vote)

print(final_preferences)
Editar y ejecutar código