1. Nauka
  2. /
  3. Kursy
  4. /
  5. Przetwarzanie języka naturalnego z użyciem spaCy

Connected

ćwiczenie

Rzutowanie wektorów słów

Wizualizacja wektorów słów na wykresie punktowym pomaga zrozumieć, jak słowa z zasobu leksykalnego są ze sobą pogrupowane. Aby to zrobić, trzeba najpierw rzutować wektory do przestrzeni dwuwymiarowej. Można to osiągnąć, wyodrębniając dwie główne składowe za pomocą analizy głównych składowych (PCA).

W tym ćwiczeniu przećwiczysz wyodrębnianie wektorów słów i ich rzutowanie do przestrzeni dwuwymiarowej przy użyciu biblioteki PCA z pakietu sklearn.

Dostępna jest krótka lista słów zapisana w zmiennej words oraz model en_core_web_md załadowany jako nlp. Wszystkie niezbędne biblioteki i pakiety są już zaimportowane (PCA, numpy jako np).

Instrukcje

100 XP
  • Wyodrębnij ID słów z podanej listy i zapisz je w zmiennej word_ids.
  • Wyodrębnij pierwsze pięć elementów wektorów słów, a następnie połącz je pionowo za pomocą np.vstack() i zapisz wynik w zmiennej word_vectors.
  • Korzystając z obiektu pca, oblicz przekształcone wektory słów przy użyciu funkcji .fit_transform() klasy pca.
  • Wyświetl pierwszą składową przekształconych wektorów słów, używając indeksowania [:, 0].