cvičení

Kontrola modelu odměn

Vracíš se k doladění modelu a zjišťuješ, že jeho výkon je stále horší než u základního modelu. Tentokrát chceš prověřit model odměn – připravil/a sis dataset s výsledky z tohoto modelu, který teď budeš analyzovat. Jaké kontroly na výstupních datech provedeš?

Dataset byl předem načten jako reward_model_results.

Pokyny

50 XP

Možné odpovědi

Zkoumání extrémních případů

Analýza rozložení datasetu

Normalizace odměn

Všechny výše uvedené

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}cvičení

Pokyny

Možné odpovědi

cvičení