Tu primer TfIdf
En este ejercicio, aplicarás el método TfIdf al pequeño conjunto de datos annak, que contiene la primera frase de Anna Karenina de León Tolstói.
Tu tarea será trabajar con este conjunto de datos y aplicar la función TfidfVectorizer(). Recuerda que realizar una transformación numérica del texto es el primer paso para poder entender el sentimiento del texto. El vectorizador Tfidf es otra forma de construir un vocabulario a partir de nuestra columna de sentimiento.
Este ejercicio forma parte del curso
Sentiment Analysis in Python
Instrucciones del ejercicio
- Importa la función para construir un vectorizador TfIdf desde
sklearn.feature_extraction.text. - Llama a la función
TfidfVectorizer()y ajústala (fit) sobre el conjunto de datosannak. - Transforma el vectorizador.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import the required function
____
annak = ['Happy families are all alike;', 'every unhappy family is unhappy in its own way']
# Call the vectorizer and fit it
anna_vect = ____.___(annak)
# Create the tfidf representation
anna_tfidf = anna_vect.____(annak)
# Print the result
print(anna_tfidf.toarray())