ComenzarEmpieza gratis

Comparar valores predichos

En el ejercicio anterior, ajustaste un modelo de regresión lineal y un GLM (logístico) usando los datos de crab, prediciendo y con width. Es decir, querías predecir la probabilidad de que la hembra tenga un cangrejo satélite cerca dado su ancho.

En este ejercicio, seguirás examinando las probabilidades estimadas (la salida) de ambos modelos e intentarás deducir si el ajuste lineal sería adecuado para el problema en cuestión.

La práctica habitual es probar el modelo con datos nuevos, no vistos. A este conjunto se le llama muestra de test.
La muestra test ya se ha creado para ti y está cargada en el espacio de trabajo. Ten en cuenta que necesitas valores de prueba para todas las variables presentes en el modelo, que en este ejemplo es width.

El conjunto de datos crab se ha precargado en el espacio de trabajo.

Este ejercicio forma parte del curso

Modelos lineales generalizados en Python

Ver curso

Instrucciones del ejercicio

  • Usa print() para ver el conjunto test.
  • Con la muestra test, calcula las probabilidades estimadas usando .predict() sobre el modelo lineal ajustado model_LM y guarda el resultado como pred_lm. Además, calcula las probabilidades estimadas usando .predict() sobre el GLM (logístico) ajustado guardado como model_GLM y guarda el resultado como pred_glm.
  • Usando pandas DataFrame(), combina las predicciones de ambos modelos y guárdalas como predictions.
  • Concatena test y predictions y guarda el resultado como all_data. Visualiza all_data usando print().

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# View test set
print(____)

# Compute estimated probabilities for linear model: pred_lm
____ = model_LM.____(____)

# Compute estimated probabilities for GLM model: pred_glm
____ = model_GLM.____(____)

# Create dataframe of predictions for linear and GLM model: predictions
____ = pd.DataFrame({'Pred_LM': ____, 'Pred_GLM': ____})

# Concatenate test sample and predictions and view the results
all_data = pd.concat([____, ____], axis = 1)
print(____)
Editar y ejecutar código