ComenzarEmpieza gratis

Bucle de active learning

Ahora que has configurado tu aprendiz activo, ¡toca usarlo! En este ejercicio, implementarás un bucle que te permitirá mejorar de forma continua la categorización de los datos.

El conjunto de datos se ha cargado con X_labeled para los datos de entrenamiento etiquetados, X_unlabeled para los datos de entrenamiento sin etiquetar y y_labeled para las etiquetas.

El objeto learner ya está importado.

Este ejercicio forma parte del curso

Reinforcement Learning from Human Feedback (RLHF)

Ver curso

Instrucciones del ejercicio

  • Implementa un bucle que ejecute 10 consultas.
  • En cada iteración, haz que el aprendiz se entrene a sí mismo usando los datos etiquetados actuales.
  • Usa el aprendiz para consultar los puntos de datos más inciertos del conjunto sin etiquetar, estableciendo el número de instancias en 5.
  • Actualiza el conjunto de datos sin etiquetar en consecuencia.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Set the number of queries
____
for _ in range(n_queries):
    # Use the current labeled data
    ____
    # Query from unlabeled data
    query_idx, _ = ____  
    X_new, y_new = X_unlabeled[query_idx], y[query_idx]  
    X_labeled = np.vstack((X_labeled, X_new))  
    y_labeled = np.append(y_labeled, y_new)  
    # Update the unlabeled dataset
    X_unlabeled = np.delete(____, query_idx, axis=0) 
Editar y ejecutar código