ćwiczenie

Tokenizacja tekstu

Chcesz wykorzystać wstępnie wytrenowany model z Hugging Face i dostroić go na danych od zespołu wsparcia swojej firmy, aby klasyfikować interakcje według ryzyka rezygnacji klienta (churn). Pomoże to zespołowi ustalać priorytety i reagować proaktywnie.

Przygotuj dane treningowe i testowe do dostrajania modelu, tokenizując tekst.

Dane oraz klasy AutoTokenizer i AutoModelForSequenceClassification zostały już wczytane.

Instrukcje

100 XP

Wczytaj wstępnie wytrenowany model i tokenizator w celu przygotowania do dostrajania.
Dokonaj tokenizacji zarówno train_data["interaction"], jak i test_data["interaction"], włączając dopełnianie (padding) i obcinanie sekwencji (truncation).

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje

ćwiczenie