Unzuverlässige Datenquelle identifizieren

Dein Team entwickelt ein Modell, das bei der Erstellung präziser Berichte in der Fahrzeugsicherheitsbranche unterstützt. Ihr habt Präferenzdaten aus drei Datenquellen gesammelt – einem "GlobalDrive Safety Institute", einer "AutoTech Safety Alliance" und "QuickScan Auto Review". Kürzlich gab es Bedenken hinsichtlich der Datenintegrität, und du wurdest gebeten, die Daten auf unzuverlässige Quellen zu prüfen.

automotive_df ist ein zusammengeführtes DataFrame, das mit der vorab importierten pandas-Bibliothek geladen wurde. Es enthält Daten aus den drei Quellen. Die vorab importierte Funktion majority_vote erstellt ein wörterbuchähnliches Objekt mit dem Mehrheits‑Paar (chosen, rejected) pro 'id'.

Diese Übung ist Teil des Kurses

<Kurs>Reinforcement Learning aus menschlichem Feedback (RLHF)</Kurs>

Übungsanweisungen

Definiere die Bedingung, um eine Uneinigkeit mit der Mehrheitsentscheidung für eine gegebene Datenquelle zu zählen.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

def detect_unreliable_source(merged_df):
    df_majority = df.groupby('id').apply(majority_vote)
    disagreements = {source: 0 for source in df['source'].unique()}
    for _, row in df.iterrows():
        # Condition to find a disagreement with majority vote
        ____
    unreliable_source = max(disagreements, key=disagreements.get)
    return unreliable_source

disagreement = detect_unreliable_source(automotive_df)
print("Unreliable Source:", disagreement)

Code bearbeiten und ausführen

Diese Übung ist Teil des Kurses

<Kurs>Reinforcement Learning aus menschlichem Feedback (RLHF)</Kurs>

Hohe SchwierigkeitSchwierigkeitsgrad

4.8+

Kurs kostenlos starten

This chapter introduces the basics of Reinforcement Learning with Human Feedback (RLHF), a technique that uses human input to help AI models learn more effectively. Get started with RLHF by understanding how it differs from traditional reinforcement learning and why human feedback can enhance AI performance in various domains.

Exercise 1: Introduction to RLHF Exercise 2: Text generation with RLHF Exercise 3: Classifying generated text for RLHF Exercise 4: RL vs. RLHF Exercise 5: Exploring pre-trained LLMs Exercise 6: Tokenize a text dataset Exercise 7: Fine-tuning for review classification Exercise 8: Preparing data for RLHF Exercise 9: Preparing the preference dataset Exercise 10: Extracting prompts

Discover how to set up systems for gathering human feedback in this Chapter. Learn best practices for collecting high-quality data, from pairwise comparisons to uncertainty sampling, and explore strategies for enhancing your data collection.

Exercise 1: Methods for high-quality feedback gathering Exercise 2: Understanding comparison and rating in RLHF Exercise 3: Comparing slogans for a gym campaign Exercise 4: Measuring feedback quality and relevance Exercise 5: Low confidence Exercise 6: K-means for feedback clustering Exercise 7: Active learning Exercise 8: Implementing an active learning pipeline Exercise 9: Active learning loop

In this Chapter, you'll get into the core of Reinforcement Learning from Human Feedback training. This includes exploring fine-tuning with PPO, techniques to train efficiently, and handling potential divergences from your metrics' objectives.

Exercise 1: Reward models explored Exercise 2: Initializing the reward Exercise 3: Setting up the reward trainer Exercise 4: Training with PPO Exercise 5: Initialize the PPO trainer Exercise 6: PPO fine-tuning Exercise 7: Efficient fine-tuning in RLHF Exercise 8: Prepare for 8-bit Training Exercise 9: Train with LoRA

Explore key techniques for assessing and improving model performance in this last Chapter of Reinforcement Learning from Human Feedback (RLHF): from fine-tuning metrics to incorporating diverse feedback sources, you'll be provided with a comprehensive toolkit to refine your models effectively.

Exercise 1: Modellmetriken und Anpassungen Exercise 2: Negative KL-Divergenz abmildern Exercise 3: Das Reward-Modell überprüfen Exercise 4: Verschiedene Feedbackquellen einbinden Exercise 5: Mehrheitsvoting über mehrere Datenquellen Exercise 6: Unzuverlässige Datenquelle identifizieren

Aktuelle Übung

Exercise 7: RLHF-Modelle bewerten Exercise 8: Kurven interpretieren Exercise 9: RLHF mit Metriken bewerten Exercise 10: Zum Abschluss deiner RLHF-Reise