Schaarse termen verwijderen
Classificatiemodellen draaien op schaarse matrices kan rekenkundig een ramp zijn. Zonder toegang tot GPU’s of cloudresources kun je op je eigen computer tegen tijd- en geheugenvraagstukken aanlopen. Je hebt een document-termmatrix gekregen en je wilt meerdere algoritmen draaien om het beste classificatiemodel te vinden. In deze oefening verwijder je enkele schaarse termen uit de gegeven matrix, matrix, op verschillende niveaus van schaarste.
Noteer voor elk schaarsteniveau het aantal overgebleven termen in de matrix.
Deze oefening maakt deel uit van de cursus
Introductie tot Natural Language Processing in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
less_sparse_matrix <-
___(___, sparse = ___)
# Print results
matrix
less_sparse_matrix