Eliminación de palabras vacías
Estás trabajando en un proyecto cuyo objetivo es clasificar los comentarios de los usuarios en diferentes categorías, como «problemas con el producto», «problemas con el servicio» y «sugerencias». A menudo, las palabras vacías no tienen mucho significado a la hora de distinguir entre categorías. Tu tarea consiste en eliminar estas palabras vacías para centrarte en las palabras importantes que ayudarán posteriormente a una máquina a clasificar los comentarios en los temas correctos.
Se han importado las funciones « word_tokenize
» de nltk.tokenize
y « stopwords.words
» de nltk.corpus
. Además, ya se han descargado los recursos NLTK punkt_tab
y stopwords
.
Este ejercicio forma parte del curso
Procesamiento del lenguaje natural (NLP) en Python
Instrucciones del ejercicio
- Convierte los comentarios proporcionados en palabras.
- Obtener la lista de palabras vacías en inglés.
- Elimina las palabras vacías del inglés y guarda el resultado en
filtered_tokens
.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
feedback = "I reached out to support and got a helpful response within minutes!!! Very #impressed"
# Tokenize the text
tokens = word_tokenize(____)
# Get the list of English stop words
stop_words = stopwords.____('____')
# Remove stop words
filtered_tokens = [____ for word in tokens if ____.lower() not in ____]
print(filtered_tokens)