1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do przetwarzania języka naturalnego w R

Connected

ćwiczenie

Usuwanie rzadkich terminów

Uruchamianie modeli klasyfikacji na rzadkich macierzach może być prawdziwym koszmarem obliczeniowym. Bez dostępu do GPU lub zasobów chmurowych możesz napotkać problemy z czasem i pamięcią na lokalnym komputerze. Otrzymujesz macierz dokumentów-terminów i planujesz przetestować kilka różnych algorytmów, aby znaleźć najlepszy model klasyfikacji. W tym ćwiczeniu usuniesz niektóre rzadkie terminy z dostarczonej macierzy matrix, stosując różne poziomy rzadkości.

Dla każdego poziomu rzadkości zwróć uwagę na liczbę pozostałych terminów w macierzy.

Instrukcje 1/4

undefined XP
  • 1
    • Usuń rzadkie terminy z macierzy dokumentów-terminów matrix, używając wartości 0,50.
  • 2
    • Usuń rzadkie terminy z macierzy dokumentów-terminów matrix, używając wartości 0,90.
  • 3
    • Usuń rzadkie terminy z macierzy dokumentów-terminów matrix, używając wartości 0,99.
  • 4
    • Usuń rzadkie terminy z macierzy dokumentów-terminów matrix, używając wartości 0,9999.