1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie przez wzmacnianie z informacją zwrotną od człowieka (RLHF)

Connected

ćwiczenie

K-means do grupowania opinii

Masz zbiór danych z odpowiedziami zwrotnymi i użyłeś modelu GPT do obliczenia wskaźników pewności dla każdej odpowiedzi. Aby wykryć nietypowe lub odstające opinie, stosujesz algorytm k-means do grupowania odpowiedzi o niskiej pewności.

Algorytm KMeans, zmienne reviews i confidences oraz biblioteka np zostały wczytane.

Instrukcje

100 XP
  • Zainicjalizuj algorytm k-means. Ustaw random_state na 42, aby zapewnić powtarzalność kodu.
  • Oblicz odległości od centrów klastrów, aby zidentyfikować wartości odstające – jako różnicę między data a odpowiadającymi im centrami klastrów.