1. Aprende
  2. /
  3. Cursos
  4. /
  5. spaCyで学ぶNatural Language Processing

Connected

Ejercicio

単語ベクトルのプロジェクション

語彙の単語がどのように群を成しているかを理解するには、散布図で単語ベクトルを可視化すると便利です。単語ベクトルを可視化するには、それらを2次元空間に射影する必要があります。射影には、主成分分析(PCA)で2つの主成分を抽出する方法が使えます。

この演習では、sklearn の PCA ライブラリを使って、単語ベクトルを抽出し、2次元空間に射影する方法を練習します。

words リストに保存された短い単語リストと、en_core_web_md モデルが用意されています。モデルは nlp として読み込まれています。必要なライブラリとパッケージ(PCA、numpy は np として)もすでにインポート済みです。

Instrucciones

100 XP
  • 与えられた単語から単語IDを抽出し、word_ids リストに保存します。
  • 単語の単語ベクトルの先頭5要素を取り出し、np.vstack() で縦方向に積み重ねて word_vectors に格納します。
  • pca オブジェクトが与えられているので、pca クラスの .fit_transform() 関数で変換後の単語ベクトルを計算します。
  • 変換後の単語ベクトルの第1主成分を [:, 0] というインデックス指定で出力します。