1. Nauka
  2. /
  3. Kursy
  4. /
  5. Przetwarzanie języka naturalnego z użyciem spaCy

Connected

ćwiczenie

Słownik spaCy

Wektory słów (ang. word vectors lub word embeddings) to numeryczne reprezentacje słów, które umożliwiają komputerom wykonywanie złożonych zadań na danych tekstowych. Wektory słów są częścią wielu modeli spaCy, choć niektóre modele ich nie zawierają.

W tym ćwiczeniu przećwiczysz dostęp do informacji o słowniku spaCy. Wybrane metadane dotyczące wektorów słów są przechowywane w każdym modelu spaCy. Możesz z nich skorzystać, aby dowiedzieć się więcej o rozmiarze słownika, wymiarach wektorów słów i innych parametrach.

Pakiet spaCy jest już zaimportowany. W metadanych modelu spaCy liczba słów jest przechowywana jako element z kluczem "vectors", a wymiar wektorów słów – jako element z kluczem "width".

Instrukcje

100 XP
  • Wczytaj model en_core_web_md.
  • Wyświetl liczbę słów w słowniku modelu en_core_web_md.
  • Wyświetl wymiary wektorów słów w modelu en_core_web_md.