Mettere insieme tutto (1)
Hai avuto un primo assaggio della scrittura delle tue funzioni negli esercizi precedenti. Hai imparato ad aggiungere parametri alle tue definizioni di funzione, a restituire un valore o più valori con le tuple e a chiamare le funzioni che hai definito.
In questo e nel successivo esercizio, riunirai tutti questi concetti e li applicherai a un semplice problema di scienza dei dati. Dovrai caricare un set di dati e sviluppare funzionalità per estrarre semplici informazioni dai dati.
Per questo esercizio, il tuo obiettivo è ricordare come caricare un set di dati in un DataFrame. Il dataset contiene i dati di Twitter e dovrai iterare sulle voci di una colonna per costruire un dizionario in cui le chiavi sono i nomi delle lingue e i valori sono il numero di tweet nella lingua in questione. Il file tweets.csv è disponibile nella tua directory corrente.
Tieni presente che si tratta di dati reali di Twitter e come tali c'è sempre il rischio che possano contenere bestemmie o altri contenuti offensivi (in questo esercizio e in tutti gli esercizi successivi che utilizzano dati reali di Twitter).
Questo esercizio fa parte del corso
Introduzione alle funzioni in Python
Istruzioni dell'esercizio
- Importa il pacchetto pandas con l'alias
pd. - Importa il file
'tweets.csv'utilizzando la funzione pandasread_csv(). Assegna il DataFrame risultante adf. - Completa il ciclo
foriterando sucol, la colonna'lang'nel DataFramedf. - Completa i corpi delle istruzioni
if-elsenel ciclo for: se la chiave si trova nel dizionariolangs_count, aggiungi1al valore corrispondente a questa chiave nel dizionario, altrimenti aggiungi la chiave alangs_counte imposta il valore corrispondente a1. Usa la variabile loopentrynel tuo codice.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import pandas
# Import Twitter data as DataFrame: df
df = ____
# Initialize an empty dictionary: langs_count
langs_count = {}
# Extract column from DataFrame: col
col = df['lang']
# Iterate over lang column in DataFrame
for entry in ____:
# If the language is in langs_count, add 1
if entry in langs_count.keys():
____
# Else add the language to langs_count, set the value to 1
else:
____
# Print the populated dictionary
print(langs_count)