LoslegenKostenlos loslegen

Klassifikationsvorhersagen

Bei der Modellvalidierung ist es oft wichtig, mehr über die Vorhersagen zu wissen als nur die finale Klassenzugehörigkeit. Wenn vorhergesagt wird, wer ein Spiel gewinnt, interessiert die meisten außerdem, wie wahrscheinlich ein Sieg ist.

Probability Prediction Meaning
0 < .50 0 Team verliert
.50 + 1 Team gewinnt

In dieser Übung schaust du dir die Methoden .predict() und .predict_proba() mit dem tic_tac_toe-Datensatz an. Die erste Methode liefert eine Vorhersage, ob Spieler eins das Spiel gewinnt, und die zweite Methode liefert die Wahrscheinlichkeit für einen Sieg von Spieler eins. Verwende rfc als Random-Forest-Klassifikationsmodell.

Diese Übung ist Teil des Kurses

Modellvalidierung in Python

Kurs anzeigen

Anleitung zur Übung

  • Erstelle zwei Arrays mit Vorhersagen: eines für die Klassifikationswerte und eines für die vorhergesagten Wahrscheinlichkeiten.
  • Verwende die Methode .value_counts() für eine pandas-Serie, um die Anzahl der Beobachtungen je Klasse auszugeben.
  • Gib die erste Beobachtung von probability_predictions aus, um zu sehen, wie die Wahrscheinlichkeiten aufgebaut sind.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Fit the rfc model. 
rfc.fit(X_train, y_train)

# Create arrays of predictions
classification_predictions = rfc.____(X_test)
probability_predictions = rfc.____(X_test)

# Print out count of binary predictions
print(pd.Series(____).____())

# Print the first value from probability_predictions
print('The first predicted probabilities are: {}'.format(____[____]))
Code bearbeiten und ausführen