Bucle de active learning
Ahora que has configurado tu aprendiz activo, ¡toca usarlo! En este ejercicio, implementarás un bucle que te permitirá mejorar de forma continua la categorización de los datos.
El conjunto de datos se ha cargado con X_labeled para los datos de entrenamiento etiquetados, X_unlabeled para los datos de entrenamiento sin etiquetar y y_labeled para las etiquetas.
El objeto learner ya está importado.
Este ejercicio forma parte del curso
Reinforcement Learning from Human Feedback (RLHF)
Instrucciones del ejercicio
- Implementa un bucle que ejecute
10consultas. - En cada iteración, haz que el aprendiz se entrene a sí mismo usando los datos etiquetados actuales.
- Usa el aprendiz para consultar los puntos de datos más inciertos del conjunto sin etiquetar, estableciendo el número de instancias en
5. - Actualiza el conjunto de datos sin etiquetar en consecuencia.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Set the number of queries
____
for _ in range(n_queries):
# Use the current labeled data
____
# Query from unlabeled data
query_idx, _ = ____
X_new, y_new = X_unlabeled[query_idx], y[query_idx]
X_labeled = np.vstack((X_labeled, X_new))
y_labeled = np.append(y_labeled, y_new)
# Update the unlabeled dataset
X_unlabeled = np.delete(____, query_idx, axis=0)