Alles samenbrengen (2)
Goed gedaan! Je hebt nu de functionaliteit gedefinieerd om over waarden in een kolom te itereren en een dictionary op te bouwen met als keys de namen van talen en als values het aantal tweets in die taal.
In deze oefening definieer je een functie met de functionaliteit die je in de vorige oefening hebt ontwikkeld, retourneer je de resulterende dictionary vanuit de functie en roep je de functie aan met de juiste argumenten.
Voor je gemak is het pandas-pakket geïmporteerd als pd en is het bestand 'tweets.csv' ingeladen in de variabele tweets_df.
Deze oefening maakt deel uit van de cursus
Introductie tot functies in Python
Oefeninstructies
- Definieer de functie
count_entries(), met twee parameters. De eerste parameter isdfvoor de DataFrame en de tweede iscol_namevoor de kolomnaam. - Vul de bodies van de
if-else-statements in defor-lus aan: if de key in de dictionarylangs_countzit, tel er1bij op; else voeg de key toe aanlangs_counten zet de waarde op1. Gebruik de lusvariabeleentryin je code. - Retourneer de
langs_count-dictionary vanuit de functiecount_entries(). - Roep de functie
count_entries()aan doortweets_dfen de naam van de kolom'lang'door te geven. Wijs het resultaat van de aanroep toe aan de variabeleresult.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Define count_entries()
def ____(____, ____):
"""Return a dictionary with counts of
occurrences as value for each key."""
# Initialize an empty dictionary: langs_count
langs_count = {}
# Extract column from DataFrame: col
col = df[col_name]
# Iterate over lang column in DataFrame
for entry in col:
# If the language is in langs_count, add 1
if entry in langs_count.keys():
____
# Else add the language to langs_count, set the value to 1
else:
____
# Return the langs_count dictionary
# Call count_entries(): result
# Print the result
print(result)