Melatih beberapa label
Berikut contoh kecil dari himpunan data yang dibuat untuk melatih tipe entitas baru WEBSITE. Himpunan data aslinya berisi beberapa ribu kalimat. Pada latihan ini, Anda akan melakukan pelabelan secara manual. Dalam praktik, Anda kemungkinan ingin mengotomatiskan proses ini dan menggunakan alat anotasi – misalnya, Brat, solusi open-source yang populer, atau Prodigy, alat anotasi kami yang terintegrasi dengan spaCy.
Setelah latihan ini, Anda hampir menyelesaikan kursus! Jika Anda menyukainya, silakan kirim ucapan terima kasih kepada Ines via Twitter – dia akan sangat menghargainya! Tweet to Ines
Latihan ini merupakan bagian dari kursus
NLP Lanjutan dengan spaCy
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
TRAINING_DATA = [
("Reddit partners with Patreon to help creators build communities",
{'entities': [(____, ____, 'WEBSITE'), (____, ____, 'WEBSITE')]}),
("PewDiePie smashes YouTube record",
{'entities': [(____, ____, 'WEBSITE')]}),
("Reddit founder Alexis Ohanian gave away two Metallica tickets to fans",
{'entities': [(____, ___, 'WEBSITE')]}),
# And so on...
]