1. Nauka
  2. /
  3. Kursy
  4. /
  5. Tworzenie chatbotów w Pythonie

Connected

ćwiczenie

wektory słów w spaCy

W tym ćwiczeniu po raz pierwszy zetkniesz się z wektorami słów! Będziesz korzystać ze zbioru danych ATIS, który zawiera tysiące zdań od prawdziwych użytkowników wchodzących w interakcję z systemem rezerwacji lotów.

Wypowiedzi użytkowników są dostępne na liście sentences, a odpowiadające im intencje – w labels.

Twoim zadaniem jest utworzenie dwuwymiarowej tablicy X z tyloma wierszami, ile jest zdań w zbiorze danych, gdzie każdy wiersz to wektor opisujący dane zdanie.

Instrukcje

100 XP
  • Wczytaj angielski model spaCy, wywołując spacy.load() z argumentem 'en'.
  • Oblicz liczbę elementów sentences za pomocą len() oraz wymiarowość wektorów słów, używając nlp.vocab.vectors_length.
  • Dla każdego zdania wywołaj obiekt nlp, przekazując sentence jako jedyny argument. Wynik zapisz jako doc.
  • Użyj atrybutu .vector obiektu doc, aby uzyskać reprezentację wektorową każdego zdania, i zapisz ten wektor w odpowiednim wierszu tablicy X.