CommencerCommencer gratuitement

Appliquer le stacking pour prédire les notes des applications

Dans cet exercice, vous allez commencer à construire votre premier ensemble en Stacking. Le jeu de données utilisé est le tout premier de la section 1. Pour rappel, l’objectif est de prédire la note de chaque application (de 1 à 5). Les variables d’entrée utilisées sont : Reviews, Size, Installs, Type, Price et Content Rating.

Nous avons déjà réalisé l’étape 1 : préparer le jeu de données. Il est disponible sous le nom apps. Nous avons nettoyé les variables nécessaires et remplacé les valeurs manquantes par des zéros.

Vous allez maintenant travailler sur l’étape 2 : construire les estimateurs de la première couche.

Cet exercice fait partie du cours

Méthodes d’ensemble en Python

Afficher le cours

Instructions

  • Créez et ajustez un classifieur par arbre de décision avec : min_samples_leaf: 3 et min_samples_split: 9.
  • Créez et ajustez un classifieur des 5 plus proches voisins en utilisant : algorithm: 'ball_tree' (pour accélérer le traitement).
  • Évaluez les performances de chaque estimateur à l’aide de l’accuracy sur l’ensemble de test.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Build and fit a Decision Tree classifier
clf_dt = ____(____, ____, random_state=500)
clf_dt.____

# Build and fit a 5-nearest neighbors classifier using the 'Ball-Tree' algorithm
clf_knn = ____
clf_knn.____

# Evaluate the performance using the accuracy score
print('Decision Tree: {:0.4f}'.format(accuracy_score(____)))
print('5-Nearest Neighbors: {:0.4f}'.format(accuracy_score(____)))
Modifier et exécuter le code