1. Learn
  2. /
  3. Курси
  4. /
  5. Робота з Hugging Face

Connected

вправа

Токенізація тексту за допомогою AutoTokenizer

AutoTokenizer спрощує підготовку тексту, автоматично виконуючи очищення, нормалізацію та токенізацію. Він гарантує, що текст обробляється саме так, як очікує модель.

У цій вправі ви дослідите, як AutoTokenizer перетворює текст на токени, готові для задач машинного навчання.

Інструкції

100 XP
  • Імпортуйте потрібний клас із transformers, завантажте токенайзер відповідним методом і розбийте вхідний текст на токени.