1. Lära sig
  2. /
  3. Courses
  4. /
  5. spaCyで学ぶNatural Language Processing

Connected

exercise

spaCyモデルをゼロから学習する

spaCy には、独自モデルを学習するためのシンプルで効率的な方法があります。この演習では、実世界のコーパス(CORD-19 データ)を用いて NER モデルをゼロから学習します。

トレーニングデータは適切な形式で training_data に用意されています。この演習では、空の英語モデル(nlp)に NER コンポーネントを追加し、labels に保存されたラベル("Pathogen"、"MedicalCondition"、"Medicine")を使用します。目的の医療系 labels を NER パイプラインに追加し、その後モデルを 1 エポック学習します。前もってインポートされた Example クラスを使って、トレーニングデータを必要な形式に変換しましょう。学習の進捗を把握するために、.update() メソッドに losses 辞書を渡してトレーニングロスを確認できます。

Instruktioner

100 XP
  • 空の spaCy モデルを作成し、モデルに NER コンポーネントを追加します。
  • ほかのパイプラインコンポーネントを無効化し、作成した optimizer オブジェクトを使って、Example 形式に変換したデータでモデル重みを更新します。