Eliminando términos poco frecuentes
Ejecutar modelos de clasificación sobre matrices dispersas puede ser un quebradero de cabeza computacional. Sin acceso a GPUs o a recursos de computación en la nube, podrías encontrarte con problemas de tiempo y memoria en tu ordenador. Te han dado una matriz documento-término y planeas ejecutar varios algoritmos para encontrar el mejor modelo de clasificación. En este ejercicio, eliminarás algunos de los términos poco frecuentes de la matriz proporcionada, matrix, con distintos niveles de dispersión.
Para cada nivel de dispersión, anota el número de términos que quedan en la matriz.
Este ejercicio forma parte del curso
Introducción al procesamiento del lenguaje natural en R
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
less_sparse_matrix <-
___(___, sparse = ___)
# Print results
matrix
less_sparse_matrix