Vetorização de texto
Agora você transformará a coluna title do conjunto de dados volunteer em um vetor de texto, que será usado em uma tarefa de previsão no próximo exercício.
Este exercício faz parte do curso
Pré-processamento para aprendizado de máquina em Python
Instruções do exercício
- Armazene a coluna
volunteer["title"]em uma variável chamadatitle_text. - Instanciar um
TfidfVectorizercomotfidf_vec. - Transforme o texto em
title_textem um vetor tf-idf usandotfidf_vec.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Take the title text
title_text = ____
# Create the vectorizer method
tfidf_vec = ____
# Transform the text into tf-idf vectors
text_tfidf = tfidf_vec.____(____)