Rzutowanie wektorów słów

Wizualizacja wektorów słów na wykresie punktowym pomaga zrozumieć, jak słowa z zasobu leksykalnego są ze sobą pogrupowane. Aby to zrobić, trzeba najpierw rzutować wektory do przestrzeni dwuwymiarowej. Można to osiągnąć, wyodrębniając dwie główne składowe za pomocą analizy głównych składowych (PCA).

W tym ćwiczeniu przećwiczysz wyodrębnianie wektorów słów i ich rzutowanie do przestrzeni dwuwymiarowej przy użyciu biblioteki PCA z pakietu sklearn.

Dostępna jest krótka lista słów zapisana w zmiennej words oraz model en_core_web_md załadowany jako nlp. Wszystkie niezbędne biblioteki i pakiety są już zaimportowane (PCA, numpy jako np).

Wyodrębnij ID słów z podanej listy i zapisz je w zmiennej word_ids.
Wyodrębnij pierwsze pięć elementów wektorów słów, a następnie połącz je pionowo za pomocą np.vstack() i zapisz wynik w zmiennej word_vectors.
Korzystając z obiektu pca, oblicz przekształcone wektory słów przy użyciu funkcji .fit_transform() klasy pca.
Wyświetl pierwszą składową przekształconych wektorów słów, używając indeksowania [:, 0].

ćwiczenie

Rzutowanie wektorów słów

Instrukcje

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje

ćwiczenie