TFIDF: tibble vs dtm
TFIDF puede usarse para similitud de documentos, clasificación de texto y otras tareas. Considera el tibble left_right_tfidf y la matriz documento-término left_right_matrix. Ambos se han cargado en la consola.
¿Cuál de las siguientes afirmaciones es verdadera?
- A: El tibble contiene una fila por documento y una columna por cada palabra usada en todo el texto.
- B: El tibble contiene los recuentos de palabras, tf, idf y los pesos tfidf para cada palabra en cada documento.
- C: El tibble y la matriz tienen el mismo número de filas.
- D: Las columnas de la matriz documento-término pueden usarse en modelos de clasificación.
Este ejercicio forma parte del curso
Introducción al procesamiento del lenguaje natural en R
Ejercicio interactivo práctico
Pon en práctica la teoría con uno de nuestros ejercicios interactivos
Empezar ejercicio