Identificar las palabras más positivas y negativas
En este ejercicio intentaremos interpretar los coeficientes de una regresión logística ajustada al conjunto de datos de opiniones sobre películas. El objeto modelo ya está instanciado y ajustado para usted en la variable lr
.
Además, las palabras correspondientes a las distintas características se cargan en la variable vocab
. Por ejemplo, como vocab[100]
es "pensar", eso significa que el rasgo 100 corresponde al número de veces que la palabra "pensar" apareció en esa crítica de cine.
Este ejercicio forma parte del curso
Clasificadores lineales en Python
Instrucciones de ejercicio
- Encuentra las palabras correspondientes a los 5 coeficientes mayores.
- Encuentra las palabras correspondientes a los 5 coeficientes más pequeños.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Get the indices of the sorted cofficients
inds_ascending = np.argsort(lr.coef_.flatten())
inds_descending = inds_ascending[::-1]
# Print the most positive words
print("Most positive words: ", end="")
for i in range(5):
print(____, end=", ")
print("\n")
# Print most negative words
print("Most negative words: ", end="")
for i in range(5):
print(____, end=", ")
print("\n")