1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie przez wzmacnianie z informacją zwrotną od człowieka (RLHF)

Connected

ćwiczenie

Wyodrębnianie promptów

Pracujesz ze zbiorem danych hendrydong/rlhf_helpful_eval, który zawiera tekst rozmów między użytkownikiem (Human) a asystentem (Assistant). Twoim celem jest wyczyszczenie tekstu i przygotowanie czystego promptu, w którym pojawia się tylko istotna treść – bez zbędnych wzorców ani tagów.

Wybierz opcję, której użyjesz do wyczyszczenia zbioru danych w celu wyodrębnienia promptów. Podgląd danych możesz zobaczyć, uruchamiając poniższy kod w konsoli:

evaluation_data.iloc[range(1)]['text'][0]

Instrukcje

50 XP

Możliwe odpowiedzi