Evaluasi model multi-kelas
Mari evaluasi pengklasifikasi awan kita dengan precision dan recall untuk melihat seberapa baik model mengklasifikasikan tujuh jenis awan. Dalam tugas klasifikasi multi-kelas, cara Anda merata-ratakan skor per kelas sangat penting. Ingat bahwa ada empat pendekatan:
- Tanpa perataan, dan menganalisis hasil per kelas;
- Micro-averaging, mengabaikan kelas dan menghitung metrik secara global;
- Macro-averaging, menghitung metrik per kelas lalu merata-ratakannya;
- Weighted-averaging, seperti macro tetapi rataan diberi bobot sesuai ukuran kelas.
Baik Precision maupun Recall sudah diimpor dari torchmetrics. Saatnya melihat seberapa baik kinerja model kita!
Latihan ini adalah bagian dari kursus
Deep Learning Lanjutan dengan PyTorch
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Define metrics
metric_precision = Precision(task=____, num_classes=____, average=____)
metric_recall = ____
net.eval()
with torch.no_grad():
for images, labels in dataloader_test:
outputs = net(images)
_, preds = torch.max(outputs, 1)
metric_precision(preds, labels)
metric_recall(preds, labels)
precision = metric_precision.compute()
recall = metric_recall.compute()
print(f"Precision: {precision}")
print(f"Recall: {recall}")