ComenzarEmpieza gratis

Cargar tuits en un DataFrame

Ahora toca importar datos en un DataFrame de pandas para poder analizar tuits a escala.

Trabajaremos con un conjunto de tuits que contienen los hashtags '#rstats' o '#python'. Este conjunto está almacenado como una lista de objetos JSON de tuits en data_science_json.

Este curso cubre muchos conceptos que quizá hayas olvidado; si necesitas un repaso rápido, descarga la chuleta de fundamentos de pandas y tenla a mano.

Ten en cuenta que se trata de datos reales de Twitter y, por tanto, siempre existe el riesgo de que aparezca lenguaje soez u otro contenido ofensivo (en este ejercicio y en cualquier ejercicio posterior que también use datos reales de Twitter).

Este ejercicio forma parte del curso

Análisis de datos de redes sociales con Python

Ver curso

Instrucciones del ejercicio

  • Importa pandas (recuerda que, por convención, lo aliasamos como pd).
  • Aplana los tuits de data_science_json con flatten_tweets() y guárdalos en tweets.
  • Crea un DataFrame a partir de tweets usando pd.DataFrame().
  • Imprime el texto de los 5 primeros tuits.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Import pandas
import ____ as ____

# Flatten the tweets and store in `tweets`
tweets = ____(____)

# Create a DataFrame from `tweets`
ds_tweets = ____(____)

# Print out the first 5 tweets from this dataset
print(ds_tweets[____].values[0:5])
Editar y ejecutar código