Applicare lo stacking per prevedere le valutazioni delle app
In questo esercizio inizierai a costruire il tuo primo ensemble di Stacking. L’insieme di dati che userai è lo stesso del Capitolo 1. Se ricordi, l’obiettivo è prevedere la valutazione di ogni app (da 1 a 5). Le caratteristiche in input che usiamo sono: Reviews, Size, Installs, Type, Price e Content Rating.
Abbiamo già svolto il passo 1: preparare l’insieme di dati. È disponibile come apps. Abbiamo ripulito le caratteristiche necessarie e sostituito i valori mancanti con zeri.
Ora lavorerai al passo 2: costruire gli stimatori del primo livello.
Questo esercizio fa parte del corso
Metodi Ensemble in Python
Istruzioni dell'esercizio
- Crea e addestra un classificatore ad albero di decisione con:
min_samples_leaf: 3emin_samples_split: 9. - Crea e addestra un classificatore 5-nearest neighbors usando:
algorithm: 'ball_tree'(per velocizzare l’elaborazione). - Valuta le prestazioni di ciascuno stimatore usando l’accuracy sul set di test.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Build and fit a Decision Tree classifier
clf_dt = ____(____, ____, random_state=500)
clf_dt.____
# Build and fit a 5-nearest neighbors classifier using the 'Ball-Tree' algorithm
clf_knn = ____
clf_knn.____
# Evaluate the performance using the accuracy score
print('Decision Tree: {:0.4f}'.format(accuracy_score(____)))
print('5-Nearest Neighbors: {:0.4f}'.format(accuracy_score(____)))