Des données Twitter vers un DataFrame
Vous disposez maintenant des données Twitter sous forme d’une liste de dictionnaires, tweets_data, où chaque dictionnaire correspond à un tweet. Vous allez extraire le texte et la langue de chaque tweet. Le texte d’un tweet t1 est stocké dans la valeur t1['text'] ; de même, la langue est stockée dans t1['lang']. Votre objectif est de construire un DataFrame où chaque ligne correspond à un tweet et dont les colonnes sont 'text' et 'lang'.
Cet exercice fait partie du cours
Importation intermédiaire de données en Python
Instructions
- Utilisez
pd.DataFrame()pour construire un DataFrame contenant les textes et les langues des tweets ; pour ce faire, le premier argument doit êtretweets_data, une liste de dictionnaires. Le second argument depd.DataFrame()est une liste des clés que vous souhaitez avoir comme colonnes. Assignez le résultat de l’appel àpd.DataFrame()àdf. - Affichez l’en-tête du DataFrame.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import package
import pandas as pd
# Build DataFrame of tweet texts and languages
df = pd.DataFrame(____, columns=____)
# Print head of DataFrame