Vetorização de texto
Agora você vai transformar a coluna desc do conjunto de dados de avistamentos de OVNIs em vetores tf/idf, já que provavelmente há algo a aprender com esse campo.
Este exercicio faz parte do curso
Pré-processamento para Machine Learning em Python
Instruções do exercicio
- Imprima o
.head()da colunadesc. - Instancie um objeto
TfidfVectorizer(). - Faça o fit e transforme a coluna
descusandovec. - Imprima o
.shapedo vetordesc_tfidfpara ver quantas colunas foram criadas.
exercicio interativo prático
Tente este exercicio completando este código de exemplo.
# Take a look at the head of the desc field
print(____)
# Instantiate the tfidf vectorizer object
vec = ____
# Fit and transform desc using vec
desc_tfidf = vec.____
# Look at the number of columns and rows
print(____.shape)