1. Nauka
  2. /
  3. Kursy
  4. /
  5. Przetwarzanie języka naturalnego z użyciem spaCy

Connected

ćwiczenie

Podobne słowa w słowniku

Wyszukiwanie semantycznie podobnych terminów ma wiele zastosowań w wyszukiwaniu informacji. W tym ćwiczeniu przećwiczysz znajdowanie terminu najbardziej zbliżonego znaczeniowo do słowa computer w słowniku modelu en_core_web_md.

Wektor słowa computer jest już wyodrębniony i zapisany jako word_vector. Model en_core_web_md jest załadowany jako nlp, a pakiet NumPy – jako np.

Do znalezienia semantycznie podobnych terminów możesz użyć funkcji .most_similar() obiektu nlp.vocab.vectors. Indeksowanie wyniku tej funkcji za pomocą [0][0] zwraca identyfikatory słów podobnych terminów. nlp.vocab.strings[<dane słowo>] pozwala znaleźć identyfikator danego słowa i analogicznie – zwrócić słowo powiązane z podanym identyfikatorem.

Instrukcje

100 XP
  • Znajdź semantycznie najbardziej podobny termin ze słownika en_core_web_md.
  • Na podstawie identyfikatorów podobnych terminów utwórz listę podobnych słów.