Comparar valores predichos
En el ejercicio anterior, ajustaste un modelo de regresión lineal y un GLM (logístico) usando los datos de crab, prediciendo y con width. Es decir, querías predecir la probabilidad de que la hembra tenga un cangrejo satélite cerca dado su ancho.
En este ejercicio, seguirás examinando las probabilidades estimadas (la salida) de ambos modelos e intentarás deducir si el ajuste lineal sería adecuado para el problema en cuestión.
La práctica habitual es probar el modelo con datos nuevos, no vistos. A este conjunto se le llama muestra de test.
La muestra test ya se ha creado para ti y está cargada en el espacio de trabajo. Ten en cuenta que necesitas valores de prueba para todas las variables presentes en el modelo, que en este ejemplo es width.
El conjunto de datos crab se ha precargado en el espacio de trabajo.
Este ejercicio forma parte del curso
Modelos lineales generalizados en Python
Instrucciones del ejercicio
- Usa
print()para ver el conjuntotest. - Con la muestra
test, calcula las probabilidades estimadas usando.predict()sobre el modelo lineal ajustadomodel_LMy guarda el resultado comopred_lm. Además, calcula las probabilidades estimadas usando.predict()sobre el GLM (logístico) ajustado guardado comomodel_GLMy guarda el resultado comopred_glm. - Usando
pandasDataFrame(), combina las predicciones de ambos modelos y guárdalas comopredictions. - Concatena
testypredictionsy guarda el resultado comoall_data. Visualizaall_datausandoprint().
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# View test set
print(____)
# Compute estimated probabilities for linear model: pred_lm
____ = model_LM.____(____)
# Compute estimated probabilities for GLM model: pred_glm
____ = model_GLM.____(____)
# Create dataframe of predictions for linear and GLM model: predictions
____ = pd.DataFrame({'Pred_LM': ____, 'Pred_GLM': ____})
# Concatenate test sample and predictions and view the results
all_data = pd.concat([____, ____], axis = 1)
print(____)