CommencerCommencer gratuitement

Boucle d’active learning

Maintenant que vous avez configuré votre apprenant actif, il est temps de l’utiliser ! Dans cet exercice, vous allez implémenter une boucle qui permettra d’améliorer continuellement la catégorisation des données.

Le jeu de données a été chargé avec X_labeled pour les données d’entraînement annotées, X_unlabeled pour les données d’entraînement non annotées, et y_labeled pour les étiquettes.

L’objet learner a été pré-importé.

Cet exercice fait partie du cours

Reinforcement Learning from Human Feedback (RLHF)

Afficher le cours

Instructions

  • Implémentez une boucle qui exécutera 10 requêtes.
  • À chaque itération, faites en sorte que l’apprenant s’entraîne sur les données actuellement annotées.
  • Utilisez l’apprenant pour interroger les points les plus incertains parmi les données non annotées, en fixant le nombre d’instances à 5.
  • Mettez à jour le jeu de données non annotées en conséquence.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Set the number of queries
____
for _ in range(n_queries):
    # Use the current labeled data
    ____
    # Query from unlabeled data
    query_idx, _ = ____  
    X_new, y_new = X_unlabeled[query_idx], y[query_idx]  
    X_labeled = np.vstack((X_labeled, X_new))  
    y_labeled = np.append(y_labeled, y_new)  
    # Update the unlabeled dataset
    X_unlabeled = np.delete(____, query_idx, axis=0) 
Modifier et exécuter le code