1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do przetwarzania języka naturalnego w R

Connected

ćwiczenie

word2vec

Zebrałeś(-aś) dużą liczbę tytułów stanowisk z internetu i zastanawiasz się, czy potrzebujesz ich jeszcze więcej do analizy. Do tej pory udało się zebrać ponad 13 000 tytułów stanowisk w zbiorze danych o nazwie job_titles. Wiesz, że word2vec działa najlepiej, gdy model ma wystarczająco dużo danych do trenowania – jeśli dane słowa pojawiają się zbyt rzadko, model może nie dawać użytecznych wyników.

W tym ćwiczeniu sprawdzisz, jak pomocne są dodatkowe dane, uruchamiając model 3 razy – za każdym razem z większą ilością danych.

Instrukcje 1/3

undefined XP
  • 1
    • Używając 33% dostępnych danych, wyświetl listę synonimów słowa teacher.
  • 2
    • Zaktualizuj kod, aby wykorzystać 66% dostępnych danych.
  • 3
    • Zaktualizuj kod, aby wykorzystać 100% dostępnych danych.