TFIDF-tibble vs dtm
TFIDF kan worden gebruikt voor documentsimilariteit, tekstclassificatie en andere taken. Bekijk de tibble left_right_tfidf en de document-termmatrix left_right_matrix. Beide zijn al in de console geladen.
Welke van de volgende beweringen is waar?
- A: De tibble bevat één rij per document en een kolom voor elk woord dat in alle tekst voorkomt.
- B: De tibble bevat de woordentellingen, tf-, idf- en tfidf-gewichten voor elk woord in elk document.
- C: De tibble en de matrix hebben hetzelfde aantal rijen.
- D: De kolommen van de document-termmatrix kunnen worden gebruikt in classificatiemodellen.
Deze oefening maakt deel uit van de cursus
Introductie tot Natural Language Processing in R
Praktische interactieve oefening
Zet theorie om in actie met een van onze interactieve oefeningen.
Begin met trainen