MulaiMulai sekarang secara gratis

Melatih beberapa label

Berikut contoh kecil dari himpunan data yang dibuat untuk melatih tipe entitas baru WEBSITE. Himpunan data aslinya berisi beberapa ribu kalimat. Pada latihan ini, Anda akan melakukan pelabelan secara manual. Dalam praktik, Anda kemungkinan ingin mengotomatiskan proses ini dan menggunakan alat anotasi – misalnya, Brat, solusi open-source yang populer, atau Prodigy, alat anotasi kami yang terintegrasi dengan spaCy.

Setelah latihan ini, Anda hampir menyelesaikan kursus! Jika Anda menyukainya, silakan kirim ucapan terima kasih kepada Ines via Twitter – dia akan sangat menghargainya! Tweet to Ines

Latihan ini adalah bagian dari kursus

NLP Lanjutan dengan spaCy

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

TRAINING_DATA = [
    ("Reddit partners with Patreon to help creators build communities", 
     {'entities': [(____, ____, 'WEBSITE'), (____, ____, 'WEBSITE')]}),
  
    ("PewDiePie smashes YouTube record", 
     {'entities': [(____, ____, 'WEBSITE')]}),
  
    ("Reddit founder Alexis Ohanian gave away two Metallica tickets to fans", 
     {'entities': [(____, ___, 'WEBSITE')]}),
    # And so on...
]
Edit dan Jalankan Kode