Eliminar signos de puntuación
Ahora que has eliminado las stop words del texto de feedback, toca ocuparse de la puntuación. Los tokens que obtuviste en el ejercicio anterior aún contienen signos de puntuación, que a menudo no aportan valor al clasificar el feedback.
Tu tarea es eliminar la puntuación de la lista de tokens proporcionada para limpiar aún más los datos.
Este ejercicio forma parte del curso
Natural Language Processing (NLP) en Python
Instrucciones del ejercicio
- Limpia la lista
filtered_tokenseliminando todos los signos de puntuación.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
import string
filtered_tokens = ['reached', 'support', 'got', 'helpful', 'response', 'within', 'minutes', '!', '!', '!', '#', 'impressed']
# Remove punctuation
clean_tokens = [____ for word in filtered_tokens if ____ not in ____.____]
print(clean_tokens)