Prevendo a avaliação de um app

Depois de explorar o conjunto de dados de apps do Google no exercício anterior, agora vamos construir um modelo que prevê a avaliação de um app com base em um subconjunto de suas características.

Para isso, você vai usar o DecisionTreeRegressor do scikit-learn. Como árvores de decisão são a base de muitos modelos de ensemble, relembrar como elas funcionam vai ajudar bastante ao longo deste curso.

Usaremos o MAE (erro absoluto médio) como métrica de avaliação. Essa métrica é bastante interpretável, pois representa a diferença absoluta média entre as avaliações reais e as previstas.

Todos os módulos necessários já foram importados para você. As features e o alvo estão disponíveis nas variáveis X e y, respectivamente.

Este exercício faz parte do curso

Métodos de Ensemble em Python

Ver curso

Instruções do exercício

Use train_test_split() para dividir X e y em conjuntos de treino e teste. Use 20%, ou 0.2, como tamanho do teste.
Instancie um DecisionTreeRegressor(), reg_dt, com os seguintes hiperparâmetros: min_samples_leaf = 3 e min_samples_split = 9.
Ajuste o regressor ao conjunto de treino usando .fit().
Faça a previsão dos rótulos do conjunto de teste usando .predict().

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Split into train (80%) and test (20%) sets
X_train, X_test, y_train, y_test = ____(____, ____, ____, random_state=42)

# Instantiate the regressor
reg_dt = ____(____, ____, random_state=500)

# Fit to the training set
____

# Evaluate the performance of the model on the test set
y_pred = ____
print('MAE: {:.3f}'.format(mean_absolute_error(y_test, y_pred)))

Editar e executar o código