Calcolare precision e recall
Il sottomodulo sklearn.metrics offre molte funzioni per calcolare facilmente metriche interessanti. Finora hai calcolato precision e recall a mano: è importante per sviluppare l’intuizione su queste due metriche.
Nella pratica, una volta fatto ciò, puoi sfruttare le funzioni precision_score e recall_score che calcolano automaticamente, rispettivamente, precision e recall. Entrambe funzionano in modo simile alle altre funzioni in sklearn.metrics: accettano 2 argomenti, il primo sono le etichette reali (y_test) e il secondo sono le etichette predette (y_pred).
Proviamo ora una dimensione di training del 90%.
Questo esercizio fa parte del corso
Marketing Analytics: Prevedere il churn dei clienti in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import train_test_split
from sklearn.model_selection import train_test_split
# Create feature variable
X = telco.drop('Churn', axis=1)
# Create target variable
y = telco['Churn']
# Create training and testing sets
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.1)
# Import RandomForestClassifier
from sklearn.ensemble import RandomForestClassifier
# Instantiate the classifier
clf = RandomForestClassifier()
# Fit to the training data
clf.fit(X_train, y_train)
# Predict the labels of the test set
y_pred = clf.predict(X_test)
# Import precision_score