ComenzarEmpieza gratis

Raíces a partir de tuits

En este ejercicio trabajarás con un array llamado tweets. Contiene el texto del conjunto de datos de sentimiento sobre aerolíneas recopilado en Twitter.

Tu tarea es trabajar con este array y transformarlo en una lista de tokens usando una list comprehension. Después, itera sobre la lista de tokens y crea la raíz (stem) de cada token. Recuerda que las list comprehensions son una alternativa en una sola línea a los bucles for.

Este ejercicio forma parte del curso

Sentiment Analysis in Python

Ver curso

Instrucciones del ejercicio

  • Importa la función que usamos para transformar cadenas en raíces (stems).
  • Llama a la función de stemmer de Porter que acabas de importar.
  • Usando una list comprehension, crea la lista tokens. Debe contener todos los tokens de palabras del array tweets.
  • Itera sobre la lista tokens y aplica la función de stemming a cada elemento de la lista.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Import the function to perform stemming
____
from nltk import word_tokenize

# Call the stemmer
porter = ____()

# Transform the array of tweets to tokens
tokens = [____]
# Stem the list of tokens
stemmed_tokens = [[____.____(word) for word in tweet] for tweet in tokens] 
# Print the first element of the list
print(stemmed_tokens[0])
Editar y ejecutar código