Siklus active learning
Sekarang setelah Anda menyiapkan active learner, saatnya menggunakannya! Dalam latihan ini, Anda akan mengimplementasikan sebuah loop yang memungkinkan peningkatan berkelanjutan pada pengkategorian data.
Himpunan data telah dimuat dengan X_labeled untuk data latih berlabel, X_unlabeled untuk data latih tanpa label, dan y_labeled untuk label.
Objek learner telah diimpor sebelumnya.
Latihan ini adalah bagian dari kursus
Reinforcement Learning from Human Feedback (RLHF)
Petunjuk latihan
- Implementasikan sebuah loop yang akan menjalankan
10kueri. - Pada setiap iterasi, biarkan learner melatih dirinya menggunakan data berlabel saat ini.
- Gunakan learner untuk mengajukan kueri terhadap titik data yang paling tidak pasti dari data tanpa label, dengan menetapkan jumlah instance menjadi
5. - Perbarui himpunan data tanpa label sesuai kebutuhan.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Set the number of queries
____
for _ in range(n_queries):
# Use the current labeled data
____
# Query from unlabeled data
query_idx, _ = ____
X_new, y_new = X_unlabeled[query_idx], y[query_idx]
X_labeled = np.vstack((X_labeled, X_new))
y_labeled = np.append(y_labeled, y_new)
# Update the unlabeled dataset
X_unlabeled = np.delete(____, query_idx, axis=0)