Des données Twitter vers un DataFrame
Vous avez maintenant les données Twitter dans une liste de dictionnaires, tweets_data, où chaque dictionnaire correspond à un tweet. Vous allez extraire le texte et la langue de chaque tweet. Le texte d’un tweet, t1, est stocké dans la valeur t1['text'] ; de même, la langue est stockée dans t1['lang']. Votre tâche est de construire un DataFrame où chaque ligne correspond à un tweet et dont les colonnes sont 'text' et 'lang'.
Cet exercice fait partie du cours
Importation intermédiaire de données en Python
Instructions
- Utilisez
pd.DataFrame()pour construire un DataFrame avec les textes et les langues des tweets ; pour cela, le premier argument doit êtretweets_data, une liste de dictionnaires. Le deuxième argument depd.DataFrame()est une liste des clés que vous souhaitez utiliser comme colonnes. Assignez le résultat de l’appel àpd.DataFrame()àdf. - Affichez l’en-tête du DataFrame.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import package
import pandas as pd
# Build DataFrame of tweet texts and languages
df = pd.DataFrame(____, columns=____)
# Print head of DataFrame