Confronto: tibble TFIDF vs dtm
TFIDF può essere usato per la similarità tra documenti, la classificazione del testo e altri compiti. Considera la tibble left_right_tfidf e la matrice documento-termine left_right_matrix. Entrambe sono già caricate in console.
Quale delle seguenti affermazioni è vera?
- A: La tibble contiene una riga per documento e una colonna per ogni parola usata in tutto il testo.
- B: La tibble contiene i conteggi delle parole, tf, idf e i pesi tfidf per ogni parola in ciascun documento.
- C: La tibble e la matrice hanno lo stesso numero di righe.
- D: Le colonne della matrice documento-termine possono essere usate nei modelli di classificazione.
Questo esercizio fa parte del corso
Introduzione all'Elaborazione del Linguaggio Naturale in R
Esercizio pratico interattivo
Passa dalla teoria alla pratica con uno dei nostri esercizi interattivi
Inizia esercizio