Aan de slagGa gratis aan de slag

Twitter-gegevens naar DataFrame

Je hebt nu de Twitter-gegevens in een lijst met dictionaries, tweets_data, waarbij elke dictionary overeenkomt met één tweet. Vervolgens ga je de tekst en taal van elke tweet extraheren. De tekst in een tweet, t1, staat als waarde opgeslagen in t1['text']; de taal staat op dezelfde manier in t1['lang']. Je taak is om een DataFrame te bouwen waarin elke rij een tweet is en de kolommen 'text' en 'lang' zijn.

Deze oefening maakt deel uit van de cursus

Gevorderd data importeren in Python

Cursus bekijken

Oefeninstructies

  • Gebruik pd.DataFrame() om een DataFrame te maken met de tweetteksten en -talen; hiervoor is het eerste argument tweets_data, een lijst met dictionaries. Het tweede argument van pd.DataFrame() is een lijst met de keys die je als kolommen wilt hebben. Wijs het resultaat van de aanroep pd.DataFrame() toe aan df.
  • Print de head van de DataFrame.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Import package
import pandas as pd

# Build DataFrame of tweet texts and languages
df = pd.DataFrame(____, columns=____)

# Print head of DataFrame

Code bewerken en uitvoeren