1. 学ぶ
  2. /
  3. コース
  4. /
  5. spaCyで学ぶNatural Language Processing

Connected

演習

spaCy でパイプを追加する

さまざまなNLPタスクで既存の spaCy モデルを使うことはよくあります。しかし、文分割のような既製のパイプラインコンポーネントでは、期待どおりの結果を得るまでに時間がかかる場合があります。この演習では、spaCy モデル(テキスト処理パイプライン)にパイプラインコンポーネントを追加する練習をします。

この演習では、Amazon Fine Food Reviews データセットの最初の5件のレビューを使用します。これらのレビューは、texts という文字列で参照できます。

spaCy パッケージはすでにインポート済みです。

指示

100 XP
  • 空の英語の spaCy モデルを読み込み、sentencizer コンポーネントをモデルに追加します。
  • texts から Doc コンテナを作成し、その文を格納する sentences のリストを作成して、文の数を出力します。
  • sentences リストの2番目の文に含まれるトークンのリストを出力します。