1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Reinforcement Learning from Human Feedback (RLHF)

Connected

cvičení

K-means pro shlukování zpětné vazby

Máš k dispozici dataset se zpětnými vazbami a GPT model jsi použil/a k výpočtu skóre spolehlivosti pro každou odpověď. Abys odhalil/a neobvyklé nebo odlehlé záznamy, aplikuješ k-means clustering na odpovědi s nízkou spolehlivostí.

Algoritmus KMeans, proměnné reviews a confidences a knihovna np jsou předem načtené.

Pokyny

100 XP
  • Inicializuj algoritmus k-means. Nastav random_state na 42 pro reprodukovatelnost kódu.
  • Vypočítej vzdálenosti od středů clusterů, abys identifikoval/a odlehlé hodnoty jako rozdíl mezi data a odpovídajícími středy clusterů.