Extrakce promptů

Pracuješ s datasetem hendrydong/rlhf_helpful_eval, který obsahuje konverzační text mezi uživatelem (Human) a asistentem (Assistant). Tvým cílem je text vyčistit a připravit čistý prompt, ve kterém zůstane jen relevantní obsah bez specifických vzorů nebo tagů.

Vyber možnost, kterou bys použil/a k vyčištění datasetu a extrakci promptů. Ukázku toho, jak dataset vypadá, zobrazíš spuštěním následujícího kódu v konzoli:

evaluation_data.iloc[range(1)]['text'][0]

Možné odpovědi

Přidat {{Role: Assistant}} do promptů

Odstranit všechny znaky nového řádku

Extrahovat pouze text mezi prvním tagem ###Human: a ###Assistant:

cvičení

Extrakce promptů

Pokyny

Možné odpovědi

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}cvičení

Pokyny

Možné odpovědi

cvičení