Prova un'altra soglia
Negli esercizi precedenti hai usato una soglia di 0,50 per trasformare le probabilità previste in predizioni di classe (roccia vs mina). Tuttavia, questa soglia di classificazione non sempre è in linea con gli obiettivi di un dato problema di modellazione.
Per esempio, immagina di voler identificare solo gli oggetti di cui sei davvero sicuro che siano mine. In questo caso potresti usare una soglia di probabilità di 0,90 per ottenere meno mine previste, ma con maggiore fiducia in ciascuna predizione.
Lo schema di codice per trasformare le probabilità in classi previste e poi calcolare una matrice di confusione è stato mostrato nell'Esercizio 7 di questo capitolo.
Questo esercizio fa parte del corso
Machine Learning con caret in R
Istruzioni dell'esercizio
- Usa
ifelse()per creare un vettore di caratteri,m_or_r, che sia la classe positiva,"M", quandopè maggiore di 0.9, e la classe negativa,"R", altrimenti. - Converti
m_or_rin un fattore,p_class, con livelli uguali a quelli ditest[["Class"]]. - Crea una matrice di confusione con
confusionMatrix(), passandop_classe la colonna"Class"del datasettest.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# If p exceeds threshold of 0.9, M else R: m_or_r
# Convert to factor: p_class
# Create confusion matrix