1. Nauka
  2. /
  3. Kursy
  4. /
  5. Przetwarzanie języka naturalnego z użyciem spaCy

Connected

ćwiczenie

Wektory słów w słowniku spaCy

Wektory słów pozwalają komputerowi rozumieć znaczenie wyrazów. W tym ćwiczeniu przećwiczysz wyodrębnianie wektorów słów dla podanej listy wyrazów.

Lista słów jest dostępna jako words. Model en_core_web_md jest już zaimportowany i dostępny jako nlp.

Słownik modelu en_core_web_md zawiera 20 000 słów. Jeśli dane słowo nie istnieje w słowniku, nie będzie można wyodrębnić odpowiadającego mu wektora. W tym ćwiczeniu, dla uproszczenia, wszystkie podane słowa znajdują się w słowniku tego modelu.

Instrukcje

100 XP
  • Wyodrębnij identyfikatory wszystkich podanych słów z listy words i zapisz je na liście ids.
  • Dla każdego identyfikatora z listy ids zapisz pierwsze dziesięć elementów wektora słowa na liście word_vectors.
  • Wyświetl pierwsze dziesięć elementów pierwszego wektora słowa z listy word_vectors.