1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Building Chatbots in Python

Connected

Cvičení

word vectors se spaCy

V tomto cvičení si poprvé vyzkoušíš práci s word vectors! Budeme pracovat s datasetem ATIS, který obsahuje tisíce vět od skutečných uživatelů komunikujících se systémem pro rezervaci letenek.

Promluvy uživatelů jsou dostupné v seznamu sentences a odpovídající záměry (intenty) v labels.

Tvým úkolem je vytvořit 2D pole X, které bude mít tolik řádků, kolik je vět v datasetu – přičemž každý řádek bude vektorová reprezentace dané věty.

Pokyny

100 XP
  • Načti anglický model spaCy voláním spacy.load() s argumentem 'en'.
  • Zjisti počet vět v sentences pomocí len() a dimenzionalitu word vectors pomocí nlp.vocab.vectors_length.
  • Pro každou větu zavolej objekt nlp s argumentem sentence a výsledek ulož jako doc.
  • Pomocí atributu .vector objektu doc získej vektorovou reprezentaci každé věty a ulož ji do příslušného řádku pole X.