ComenzarEmpieza gratis

Eliminación de palabras vacías

Estás trabajando en un proyecto cuyo objetivo es clasificar los comentarios de los usuarios en diferentes categorías, como «problemas con el producto», «problemas con el servicio» y «sugerencias». A menudo, las palabras vacías no tienen mucho significado a la hora de distinguir entre categorías. Tu tarea consiste en eliminar estas palabras vacías para centrarte en las palabras importantes que ayudarán posteriormente a una máquina a clasificar los comentarios en los temas correctos.

Se han importado las funciones « word_tokenize » de nltk.tokenize y « stopwords.words » de nltk.corpus. Además, ya se han descargado los recursos NLTK punkt_tab y stopwords.

Este ejercicio forma parte del curso

Procesamiento del lenguaje natural (NLP) en Python

Ver curso

Instrucciones del ejercicio

  • Convierte los comentarios proporcionados en palabras.
  • Obtener la lista de palabras vacías en inglés.
  • Elimina las palabras vacías del inglés y guarda el resultado en filtered_tokens.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

feedback = "I reached out to support and got a helpful response within minutes!!! Very #impressed"

# Tokenize the text
tokens = word_tokenize(____)

# Get the list of English stop words
stop_words = stopwords.____('____')

# Remove stop words 
filtered_tokens = [____ for word in tokens if ____.lower() not in ____]

print(filtered_tokens)
Editar y ejecutar código