1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie przez wzmacnianie z informacją zwrotną od człowieka (RLHF)

Connected

ćwiczenie

Identyfikacja niewiarygodnych źródeł danych

Twój zespół opracowuje model wspomagający generowanie dokładnych raportów w branży bezpieczeństwa motoryzacyjnego. Zebrano dane preferencji z trzech źródeł: „GlobalDrive Safety Institute", „AutoTech Safety Alliance" oraz „QuickScan Auto Review". Ostatnio pojawiły się wątpliwości co do wiarygodności tych danych i poproszono cię o ocenę, czy któreś ze źródeł jest niewiarygodne.

automotive_df to połączony DataFrame wczytany przy użyciu wstępnie zaimportowanej biblioteki pandas. Zawiera dane ze wszystkich trzech źródeł. Wstępnie zaimportowana funkcja majority_vote tworzy obiekt słownikopodobny z parą (chosen, rejected) wybraną głosowaniem większościowym dla każdego 'id'.

Instrukcje

100 XP
  • Zdefiniuj warunek zliczania jednej niezgodności z głosowaniem większościowym dla danego źródła danych.