Predecir probabilidades de reseñas de películas
En este ejercicio, construirás una regresión logística usando el conjunto de datos movies. Las etiquetas están en el array y y las características en X.
Entrena el modelo con los datos de entrenamiento. En lugar de predecir clases, predice las probabilidades de que cada instancia del conjunto de prueba pertenezca a cada una de las dos clases.
Las funciones de regresión logística y de división en entrenamiento/prueba ya han sido importadas para ti.
Este ejercicio forma parte del curso
Sentiment Analysis in Python
Instrucciones del ejercicio
- Divide los datos en conjuntos de entrenamiento y prueba.
- Entrena un modelo de regresión logística.
- Predice las probabilidades para la clase 0 y para la clase 1 de los datos de prueba. La clase 0 aparece en la primera columna de las probabilidades predichas y la clase 1 en la segunda.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Split into training and testing
X_train, X_test, y_train, y_test = ____(___, ___, test_size=0.2, random_state=321)
# Train a logistic regression
log_reg = ____.____
# Predict the probability of the 0 class
prob_0 = log_reg.____[:, ____]
# Predict the probability of the 1 class
prob_1 = log_reg.____[:, ____]
print("First 10 predicted probabilities of class 0: ", prob_0[:10])
print("First 10 predicted probabilities of class 1: ", prob_1[:10])