Vetorização de texto
Agora você transformará a coluna title
do conjunto de dados volunteer
em um vetor de texto, que será usado em uma tarefa de previsão no próximo exercício.
Este exercício faz parte do curso
Pré-processamento para aprendizado de máquina em Python
Instruções de exercício
- Armazene a coluna
volunteer["title"]
em uma variável chamadatitle_text
. - Instanciar um
TfidfVectorizer
comotfidf_vec
. - Transforme o texto em
title_text
em um vetor tf-idf usandotfidf_vec
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Take the title text
title_text = ____
# Create the vectorizer method
tfidf_vec = ____
# Transform the text into tf-idf vectors
text_tfidf = tfidf_vec.____(____)