Twitter-gegevens naar DataFrame
Je hebt nu de Twitter-gegevens in een lijst met dictionaries, tweets_data, waarbij elke dictionary overeenkomt met één tweet. Vervolgens ga je de tekst en taal van elke tweet extraheren. De tekst in een tweet, t1, staat als waarde opgeslagen in t1['text']; de taal staat op dezelfde manier in t1['lang']. Je taak is om een DataFrame te bouwen waarin elke rij een tweet is en de kolommen 'text' en 'lang' zijn.
Deze oefening maakt deel uit van de cursus
Gevorderd data importeren in Python
Oefeninstructies
- Gebruik
pd.DataFrame()om een DataFrame te maken met de tweetteksten en -talen; hiervoor is het eerste argumenttweets_data, een lijst met dictionaries. Het tweede argument vanpd.DataFrame()is een lijst met de keys die je als kolommen wilt hebben. Wijs het resultaat van de aanroeppd.DataFrame()toe aandf. - Print de head van de DataFrame.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import package
import pandas as pd
# Build DataFrame of tweet texts and languages
df = pd.DataFrame(____, columns=____)
# Print head of DataFrame