Langkah persiapan pelatihan
Sebelum dan selama pelatihan model spaCy, Anda perlu (1) menonaktifkan komponen pipeline lain agar hanya komponen yang dituju yang dilatih dan (2) mengonversi kontainer Doc dari satu data pelatihan beserta annotations terkaitnya menjadi kelas Example.
Dalam latihan ini, Anda akan mempraktikkan dua langkah tersebut dengan menggunakan model en_core_web_sm yang telah dimuat dan dapat diakses sebagai nlp. Kelas Example sudah diimpor dan string text beserta annotations terkait juga telah tersedia untuk Anda gunakan.
Latihan ini adalah bagian dari kursus
Pemrosesan Bahasa Alami dengan spaCy
Petunjuk latihan
- Nonaktifkan semua komponen pipeline dari model
nlpkecualiner. - Konversikan string
textdanannotations-nya ke format yang benar untuk digunakan dalam pelatihan.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
nlp = spacy.load("en_core_web_sm")
# Disable all pipeline components of except `ner`
other_pipes = [____ for ____ in nlp.____ if ____ != 'ner']
nlp.____(*other_pipes)
# Convert a text and its annotations to the correct format usable for training
doc = nlp.____(text)
example = Example.____(____, ____)
print("Example object for training: \n", example.to_dict())