Cargar tuits en un DataFrame
Ahora toca importar datos en un DataFrame de pandas para poder analizar tuits a escala.
Trabajaremos con un conjunto de tuits que contienen los hashtags '#rstats' o '#python'. Este conjunto está almacenado como una lista de objetos JSON de tuits en data_science_json.
Este curso cubre muchos conceptos que quizá hayas olvidado; si necesitas un repaso rápido, descarga la chuleta de fundamentos de pandas y tenla a mano.
Ten en cuenta que se trata de datos reales de Twitter y, por tanto, siempre existe el riesgo de que aparezca lenguaje soez u otro contenido ofensivo (en este ejercicio y en cualquier ejercicio posterior que también use datos reales de Twitter).
Este ejercicio forma parte del curso
Análisis de datos de redes sociales con Python
Instrucciones del ejercicio
- Importa
pandas(recuerda que, por convención, lo aliasamos comopd). - Aplana los tuits de
data_science_jsonconflatten_tweets()y guárdalos entweets. - Crea un DataFrame a partir de
tweetsusandopd.DataFrame(). - Imprime el texto de los 5 primeros tuits.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import pandas
import ____ as ____
# Flatten the tweets and store in `tweets`
tweets = ____(____)
# Create a DataFrame from `tweets`
ds_tweets = ____(____)
# Print out the first 5 tweets from this dataset
print(ds_tweets[____].values[0:5])