Aan de slagGa gratis aan de slag

TFIDF-tibble vs dtm

TFIDF kan worden gebruikt voor documentsimilariteit, tekstclassificatie en andere taken. Bekijk de tibble left_right_tfidf en de document-termmatrix left_right_matrix. Beide zijn al in de console geladen.

Welke van de volgende beweringen is waar?

  • A: De tibble bevat één rij per document en een kolom voor elk woord dat in alle tekst voorkomt.
  • B: De tibble bevat de woordentellingen, tf-, idf- en tfidf-gewichten voor elk woord in elk document.
  • C: De tibble en de matrix hebben hetzelfde aantal rijen.
  • D: De kolommen van de document-termmatrix kunnen worden gebruikt in classificatiemodellen.

Deze oefening maakt deel uit van de cursus

Introductie tot Natural Language Processing in R

Cursus bekijken

Praktische interactieve oefening

Zet theorie om in actie met een van onze interactieve oefeningen.

Begin met trainen