Trade-off tussen precisie en recall

Bij classificatietaken kom je vaak de term Precision-Recall trade-off tegen. Waar komt die vandaan?

Meestal kies je de klasse met de hoogste waarschijnlijkheid om het document aan toe te wijzen. Maar wat als de maximale waarschijnlijkheid 0.1 is? Moet je dan vinden dat dit document met slechts 10% kans tot deze klasse behoort?

Het antwoord hangt af van het probleem. Je kunt een minimale drempel instellen om de classificatie te accepteren, en als je die drempel aanpast, bewegen de waarden voor precision en recall in tegengestelde richting.

De variabelen y_true en het model model zijn al geladen. Als de waarschijnlijkheid lager is dan de drempel, wordt het document toegewezen aan DEFAULT_CLASS (gekozen als klasse 2).

Deze oefening maakt deel uit van de cursus

Recurrent Neural Networks (RNN's) voor taalmodellen met Keras

Oefeninstructies

Gebruik de .predict()-methode om de waarschijnlijkheden voor elke klasse op te halen en sla ze op in de variabele pred_probabilities.
Accepteer de maximale waarschijnlijkheid alleen als die groter dan of gelijk aan 0.5 is en sla de resultaten op in de variabele y_pred_50.
Gebruik de functies np.argmax() en np.max() om hetzelfde te doen voor een drempel gelijk aan 0.8.
Print de variabele trade_off met alle statistieken.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Get probabilities for each class
pred_probabilities = model.____(X_test)

# Thresholds at 0.5 and 0.8
y_pred_50 = [np.argmax(x) if np.max(x) >= ____ else DEFAULT_CLASS for x in pred_probabilities]
y_pred_80 = [np.____(x) if np.____(x) >= 0.8 else DEFAULT_CLASS for x in pred_probabilities]

trade_off = pd.DataFrame({
    'Precision_50': precision_score(y_true, y_pred_50, average=None), 
    'Precision_80': precision_score(y_true, y_pred_80, average=None), 
    'Recall_50': recall_score(y_true, y_pred_50, average=None), 
    'Recall_80': recall_score(y_true, y_pred_80, average=None)}, 
  index=['Class 1', 'Class 2', 'Class 3'])

____

Code bewerken en uitvoeren

Deze oefening maakt deel uit van de cursus

Recurrent Neural Networks (RNN's) voor taalmodellen met Keras

SkillTag.level.advancedSkillTag.label

4.8+

Begin gratis met de cursus

In dit hoofdstuk leer je de basis van Recurrent Neural Networks (RNN). We beginnen met enkele vereisten, bekijken hoe informatie door het netwerk stroomt en laten tot slot zien hoe je zulke modellen met Keras implementeert voor een taak in sentimentclassificatie.

Exercise 1: Introductie van de cursus Exercise 2: Het aantal parameters van RNN en ANN vergelijken Exercise 3: Sentimentanalyse Exercise 4: Sequence-to-sequence-modellen Exercise 5: Introductie tot taalmodellen Exercise 6: Wennen aan tekstdata Exercise 7: Tekstgegevens voorbereiden voor modelinvoer Exercise 8: Nieuwe tekst transformeren Exercise 9: Introductie tot RNN in Keras Exercise 10: Keras-modellen Exercise 11: Keras-preprocessing Exercise 12: Je eerste RNN-model

Je leert over het vanishing- en exploding-gradient-probleem, dat vaak voorkomt bij RNN's, en hoe je dit aanpakt met GRU- en LSTM-cellen. Verder maak je embedding-lagen voor taalmodellen en pak je de taak van sentimentclassificatie opnieuw op.

Exercise 1: Ver verdwijnende en exploderende gradiënten Exercise 2: Exploding gradient-probleem Exercise 3: Vanishing gradient-probleem Exercise 4: GRU- en LSTM-cellen Exercise 5: GRU-cellen zijn beter dan SimpleRNN Exercise 6: RNN-lagen stapelen Exercise 7: De Embedding-laag Exercise 8: Vergelijking van het aantal parameters Exercise 9: Transfer learning Exercise 10: Embeddings verbeteren de prestaties Exercise 11: Sentimentclassificatie herbekeken Exercise 12: Betere sentimentclassificatie Exercise 13: De CNN-laag gebruiken

Vervolgens leer je in dit hoofdstuk hoe je data voorbereidt voor een multiclass-classificatietaak, en wat de verschillen zijn tussen multiclass-classificatie en binaire classificatie (sentimentanalyse). Tot slot leer je hoe je modellen bouwt en hun prestaties meet met Keras.

Exercise 1: Data preprocessing Exercise 2: Labelvectoren voorbereiden Exercise 3: Data pre-processen Exercise 4: Transfer learning voor taalmodellen Exercise 5: Startpunt voor transfer learning Exercise 6: Word2Vec Exercise 7: Modellen voor multiclass-classificatie Exercise 8: De 20 Newsgroups-gegevensset verkennen Exercise 9: Nieuwsartikelen classificeren Exercise 10: De prestatie van het model beoordelen Exercise 11: Trade-off tussen precisie en recall

Huidige oefening

Exercise 12: Precision of Recall, dát is de vraag Exercise 13: Prestaties bij multi-class classificatie

Dit hoofdstuk introduceert twee toepassingen van RNN-modellen: tekstgeneratie en Neural Machine Translation. Je leert hoe je de tekstdata voorbereidt in het formaat dat de modellen nodig hebben. Het tekstgeneratiemodel wordt gebruikt om de manier van spreken van een personage na te bootsen en we hebben wat lol met het imiteren van Sheldon uit The Big Bang Theory. Neural Machine Translation wordt bijvoorbeeld door Google Translate gebruikt in een veel complexer model. In dit hoofdstuk maak je een model dat korte Portugese zinnen naar het Engels vertaalt.

Exercise 1: Sequence-to-sequence-modellen Exercise 2: Voorbeelden van tekstgeneratie Exercise 3: NMT-voorbeeld Exercise 4: De tekstgeneratiefunctie Exercise 5: Voorspel het volgende teken Exercise 6: Genereer zin met context Exercise 7: Pas de waarschijnlijkheidsschaal aan Exercise 8: Modellen voor tekengeneratie Exercise 9: Maak vectoren van zinnen en volgende tekens Exercise 10: De data voorbereiden voor training Exercise 11: Het tekstgeneratiemodel maken Exercise 12: Neurale machinevertaling Exercise 13: De invoertekst voorbereiden Exercise 14: De uitvoertekst voorbereiden Exercise 15: Vertaal Portugees naar Engels Exercise 16: Gefeliciteerd!