Calculer la précision et le rappel
Le sous-module sklearn.metrics propose de nombreuses fonctions pour calculer facilement des métriques utiles. Jusqu’à présent, vous avez calculé la précision et le rappel à la main : c’est essentiel pour développer votre intuition sur ces deux métriques.
En pratique, une fois cette intuition acquise, vous pouvez utiliser les fonctions precision_score et recall_score qui calculent automatiquement la précision et le rappel, respectivement. Toutes deux fonctionnent comme les autres fonctions de sklearn.metrics : elles prennent 2 arguments : le premier correspond aux étiquettes réelles (y_test), et le second aux étiquettes prédites (y_pred).
Essayons maintenant une taille d’entraînement de 90 %.
Cet exercice fait partie du cours
Marketing Analytics : prédire l’attrition client en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import train_test_split
from sklearn.model_selection import train_test_split
# Create feature variable
X = telco.drop('Churn', axis=1)
# Create target variable
y = telco['Churn']
# Create training and testing sets
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.1)
# Import RandomForestClassifier
from sklearn.ensemble import RandomForestClassifier
# Instantiate the classifier
clf = RandomForestClassifier()
# Fit to the training data
clf.fit(X_train, y_train)
# Predict the labels of the test set
y_pred = clf.predict(X_test)
# Import precision_score