1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do przetwarzania języka naturalnego w R

Connected

ćwiczenie

Tibble TFIDF a dtm

TFIDF można stosować do badania podobieństwa dokumentów, klasyfikacji tekstu i innych zadań. Przeanalizuj tibble left_right_tfidf oraz macierz dokument-termin left_right_matrix. Oba obiekty zostały wczytane do konsoli.

Które z poniższych stwierdzeń jest prawdziwe?

  • A: Tibble zawiera jeden wiersz na dokument i jedną kolumnę dla każdego słowa występującego w całym tekście.
  • B: Tibble zawiera liczby wystąpień słów oraz wagi tf, idf i tfidf dla każdego słowa w każdym dokumencie.
  • C: Tibble i macierz mają tę samą liczbę wierszy.
  • D: Kolumny macierzy dokument-termin można wykorzystać w modelach klasyfikacji.

Instrukcje

50 XP

Możliwe odpowiedzi