Melatih beberapa label
Berikut contoh kecil dari himpunan data yang dibuat untuk melatih tipe entitas baru WEBSITE. Himpunan data aslinya berisi beberapa ribu kalimat. Pada latihan ini, Anda akan melakukan pelabelan secara manual. Dalam praktik, Anda kemungkinan ingin mengotomatiskan proses ini dan menggunakan alat anotasi – misalnya, Brat, solusi open-source yang populer, atau Prodigy, alat anotasi kami yang terintegrasi dengan spaCy.
Setelah latihan ini, Anda hampir menyelesaikan kursus! Jika Anda menyukainya, silakan kirim ucapan terima kasih kepada Ines via Twitter – dia akan sangat menghargainya! Tweet to Ines
Latihan ini adalah bagian dari kursus
NLP Lanjutan dengan spaCy
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
TRAINING_DATA = [
("Reddit partners with Patreon to help creators build communities",
{'entities': [(____, ____, 'WEBSITE'), (____, ____, 'WEBSITE')]}),
("PewDiePie smashes YouTube record",
{'entities': [(____, ____, 'WEBSITE')]}),
("Reddit founder Alexis Ohanian gave away two Metallica tickets to fans",
{'entities': [(____, ___, 'WEBSITE')]}),
# And so on...
]