1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Reinforcement Learning from Human Feedback (RLHF)

Connected

cvičení

Identifikace nespolehlivých zdrojů dat

Tvůj tým vyvíjí model pro podporu tvorby přesných reportů v oblasti automobilové bezpečnosti. Shromáždil/a jsi preferenční data ze tří zdrojů – „GlobalDrive Safety Institute", „AutoTech Safety Alliance" a „QuickScan Auto Review". Nedávno se objevily obavy ohledně integrity dat a tvým úkolem je posoudit, zda některý ze zdrojů není nespolehlivý.

automotive_df je kombinovaný DataFrame načtený pomocí předem importované knihovny pandas. Obsahuje data ze všech tří zdrojů. Předem importovaná funkce majority_vote vytvoří slovníkový objekt s většinovým párem (chosen, rejected) pro každé 'id'.

Pokyny

100 XP
  • Definuj podmínku pro zaznamenání jedné neshody s většinovým hlasováním u daného zdroje dat.