Boucle d’active learning
Maintenant que vous avez configuré votre apprenant actif, il est temps de l’utiliser ! Dans cet exercice, vous allez implémenter une boucle qui permettra d’améliorer continuellement la catégorisation des données.
Le jeu de données a été chargé avec X_labeled pour les données d’entraînement annotées, X_unlabeled pour les données d’entraînement non annotées, et y_labeled pour les étiquettes.
L’objet learner a été pré-importé.
Cet exercice fait partie du cours
Reinforcement Learning from Human Feedback (RLHF)
Instructions
- Implémentez une boucle qui exécutera
10requêtes. - À chaque itération, faites en sorte que l’apprenant s’entraîne sur les données actuellement annotées.
- Utilisez l’apprenant pour interroger les points les plus incertains parmi les données non annotées, en fixant le nombre d’instances à
5. - Mettez à jour le jeu de données non annotées en conséquence.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Set the number of queries
____
for _ in range(n_queries):
# Use the current labeled data
____
# Query from unlabeled data
query_idx, _ = ____
X_new, y_new = X_unlabeled[query_idx], y[query_idx]
X_labeled = np.vstack((X_labeled, X_new))
y_labeled = np.append(y_labeled, y_new)
# Update the unlabeled dataset
X_unlabeled = np.delete(____, query_idx, axis=0)