Mettere insieme tutto (1)
Ricorda l'esercizio "Mettere insieme tutto" del capitolo precedente, in cui hai fatto una semplice analisi di Twitter sviluppando una funzione che conta il numero di tweet in determinate lingue. L'output della tua funzione era un dizionario che aveva come chiavi la lingua e come valore il numero di tweet in quella lingua.
In questo esercizio generalizzeremo l'analisi del linguaggio di Twitter che hai fatto nel capitolo precedente. Lo farai includendo un argomento predefinito che accetta il nome di una colonna.
Per comodità, pandas è stato importato come pd e il file 'tweets.csv' è stato importato nel DataFrame tweets_df. Vengono fornite anche parti del codice del tuo lavoro precedente.
Questo esercizio fa parte del corso
Introduzione alle funzioni in Python
Istruzioni dell'esercizio
- Completa l'intestazione della funzione fornendo il parametro per un DataFrame
dfe il parametrocol_namecon un valore predefinito di'lang'per il nome della colonna del DataFrame. - Chiama
count_entries()passando il DataFrametweets_dfe il nome della colonna'lang'. Assegna il risultato aresult1. Nota che poiché'lang'è il valore predefinito del parametrocol_name, non è necessario specificarlo qui. - Chiama
count_entries()passando il DataFrametweets_dfe il nome della colonna'source'. Assegna il risultato aresult2.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Define count_entries()
def count_entries(____, ____):
"""Return a dictionary with counts of
occurrences as value for each key."""
# Initialize an empty dictionary: cols_count
cols_count = {}
# Extract column from DataFrame: col
col = df[col_name]
# Iterate over the column in DataFrame
for entry in col:
# If entry is in cols_count, add 1
if entry in cols_count.keys():
cols_count[entry] += 1
# Else add the entry to cols_count, set the value to 1
else:
cols_count[entry] = 1
# Return the cols_count dictionary
return cols_count
# Call count_entries(): result1
result1 = ____
# Call count_entries(): result2
result2 = ____
# Print result1 and result2
print(result1)
print(result2)