Confusion matrices
Je hebt zojuist een classificatiemodel gemaakt. Dit model voorspelt of tweets zijn geplaatst door een links georiënteerde (democraat) of rechts georiënteerde (republikein) tweetbot. Je hebt voorspellingen gedaan op de testdata en hebt het volgende resultaat:
| Predictions | Left | Right |
|---|---|---|
| Left | 350 | 157 |
| Right | 57 | 436 |
Gebruik de confusion matrix hierboven om vragen over de nauwkeurigheid van het model te beantwoorden.
Deze oefening maakt deel uit van de cursus
Introductie tot Natural Language Processing in R
Oefeninstructies
- Welk percentage van de tweets heb je succesvol gelabeld als
Left? - Welk percentage van de tweets heb je succesvol gelabeld als
Right? - Welk percentage van de tweets heb je succesvol gelabeld?
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Percentage correctly labeled "Left"
left <- (___) / (350 + 157)
left
# Percentage correctly labeled "Right"
right <- (___) / (___ + ___)
right
# Overall Accuracy:
accuracy <- (___ + ___) / (___ + ___ + ___ + ___)
accuracy