ComenzarEmpieza gratis

TFIDF: tibble vs dtm

TFIDF puede usarse para similitud de documentos, clasificación de texto y otras tareas. Considera el tibble left_right_tfidf y la matriz documento-término left_right_matrix. Ambos se han cargado en la consola.

¿Cuál de las siguientes afirmaciones es verdadera?

  • A: El tibble contiene una fila por documento y una columna por cada palabra usada en todo el texto.
  • B: El tibble contiene los recuentos de palabras, tf, idf y los pesos tfidf para cada palabra en cada documento.
  • C: El tibble y la matriz tienen el mismo número de filas.
  • D: Las columnas de la matriz documento-término pueden usarse en modelos de clasificación.

Este ejercicio forma parte del curso

Introducción al procesamiento del lenguaje natural en R

Ver curso

Ejercicio interactivo práctico

Pon en práctica la teoría con uno de nuestros ejercicios interactivos

Empezar ejercicio