IniziaInizia gratis

Mettere insieme tutto (1)

Hai avuto un primo assaggio della scrittura delle tue funzioni negli esercizi precedenti. Hai imparato ad aggiungere parametri alle tue definizioni di funzione, a restituire un valore o più valori con le tuple e a chiamare le funzioni che hai definito.

In questo e nel successivo esercizio, riunirai tutti questi concetti e li applicherai a un semplice problema di scienza dei dati. Dovrai caricare un set di dati e sviluppare funzionalità per estrarre semplici informazioni dai dati.

Per questo esercizio, il tuo obiettivo è ricordare come caricare un set di dati in un DataFrame. Il dataset contiene i dati di Twitter e dovrai iterare sulle voci di una colonna per costruire un dizionario in cui le chiavi sono i nomi delle lingue e i valori sono il numero di tweet nella lingua in questione. Il file tweets.csv è disponibile nella tua directory corrente.

Tieni presente che si tratta di dati reali di Twitter e come tali c'è sempre il rischio che possano contenere bestemmie o altri contenuti offensivi (in questo esercizio e in tutti gli esercizi successivi che utilizzano dati reali di Twitter).

Questo esercizio fa parte del corso

Introduzione alle funzioni in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Importa il pacchetto pandas con l'alias pd.
  • Importa il file 'tweets.csv' utilizzando la funzione pandas read_csv(). Assegna il DataFrame risultante a df.
  • Completa il ciclo for iterando su col, la colonna 'lang' nel DataFrame df.
  • Completa i corpi delle istruzioni if-else nel ciclo for: se la chiave si trova nel dizionario langs_count, aggiungi 1 al valore corrispondente a questa chiave nel dizionario, altrimenti aggiungi la chiave a langs_count e imposta il valore corrispondente a 1. Usa la variabile loop entry nel tuo codice.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Import pandas


# Import Twitter data as DataFrame: df
df = ____

# Initialize an empty dictionary: langs_count
langs_count = {}

# Extract column from DataFrame: col
col = df['lang']

# Iterate over lang column in DataFrame
for entry in ____:

    # If the language is in langs_count, add 1 
    if entry in langs_count.keys():
        ____
    # Else add the language to langs_count, set the value to 1
    else:
        ____

# Print the populated dictionary
print(langs_count)
Modifica ed esegui il codice