Active-Learning-Schleife
Jetzt, da du deinen Active Learner eingerichtet hast, wird es Zeit, ihn zu nutzen! In dieser Übung implementierst du eine Schleife, mit der sich die Kategorisierung der Daten kontinuierlich verbessern lässt.
Der Datensatz wurde mit X_labeled für gelabelte Trainingsdaten, X_unlabeled für ungelabelte Trainingsdaten und y_labeled für Labels geladen.
Das Objekt learner wurde bereits importiert.
Diese Übung ist Teil des Kurses
Reinforcement Learning aus menschlichem Feedback (RLHF)
Anleitung zur Übung
- Implementiere eine Schleife, die
10Abfragen ausführt. - Lass in jeder Iteration den Learner mit den aktuellen gelabelten Daten selbst lernen.
- Nutze den Learner, um die unsichersten Datenpunkte aus den ungelabelten Daten abzufragen, und setze die Anzahl der Instanzen auf
5. - Aktualisiere das ungelabelte Dataset entsprechend.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Set the number of queries
____
for _ in range(n_queries):
# Use the current labeled data
____
# Query from unlabeled data
query_idx, _ = ____
X_new, y_new = X_unlabeled[query_idx], y[query_idx]
X_labeled = np.vstack((X_labeled, X_new))
y_labeled = np.append(y_labeled, y_new)
# Update the unlabeled dataset
X_unlabeled = np.delete(____, query_idx, axis=0)