Predecir probabilidades de reseñas de películas

En este ejercicio, construirás una regresión logística usando el conjunto de datos movies. Las etiquetas están en el array y y las características en X.

Entrena el modelo con los datos de entrenamiento. En lugar de predecir clases, predice las probabilidades de que cada instancia del conjunto de prueba pertenezca a cada una de las dos clases.

Las funciones de regresión logística y de división en entrenamiento/prueba ya han sido importadas para ti.

Este ejercicio forma parte del curso

Sentiment Analysis in Python

Ver curso

Instrucciones del ejercicio

Divide los datos en conjuntos de entrenamiento y prueba.
Entrena un modelo de regresión logística.
Predice las probabilidades para la clase 0 y para la clase 1 de los datos de prueba. La clase 0 aparece en la primera columna de las probabilidades predichas y la clase 1 en la segunda.

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

# Split into training and testing
X_train, X_test, y_train, y_test = ____(___, ___, test_size=0.2, random_state=321)

# Train a logistic regression
log_reg = ____.____

# Predict the probability of the 0 class
prob_0 = log_reg.____[:, ____]
# Predict the probability of the 1 class
prob_1 = log_reg.____[:, ____]

print("First 10 predicted probabilities of class 0: ", prob_0[:10])
print("First 10 predicted probabilities of class 1: ", prob_1[:10])

Editar y ejecutar código