1. Learn
  2. /
  3. Courses
  4. /
  5. NLP nâng cao với spaCy

Connected

Exercise

Huấn luyện nhiều nhãn

Dưới đây là một mẫu nhỏ của tập dữ liệu được tạo để huấn luyện một loại thực thể mới WEBSITE. Tập dữ liệu gốc có vài nghìn câu. Trong bài tập này, bạn sẽ tự tay gán nhãn. Trong thực tế, bạn có thể muốn tự động hóa bước này và dùng công cụ gán nhãn – ví dụ, Brat, một giải pháp mã nguồn mở phổ biến, hoặc Prodigy, công cụ gán nhãn của chúng tôi tích hợp với spaCy.

Sau bài tập này là bạn gần như đã hoàn thành khóa học! Nếu bạn thích khóa học, cứ thoải mái gửi lời cảm ơn đến Ines trên Twitter – cô ấy sẽ rất trân trọng! Tweet cho Ines

Instructions 1/3

undefined XP
    1
    2
    3
  • Hoàn thiện các offset của thực thể WEBSITE trong dữ liệu. Bạn có thể dùng len() nếu không muốn đếm ký tự thủ công.