CommencerCommencer gratuitement

On mélange tout (1)

Rappelez-vous l’exercice On mélange tout dans le chapitre précédent où vous avez effectué une analyse simple de Twitter en développant une fonction qui compte le nombre de tweets dans certaines langues. La sortie de votre fonction était un dictionnaire dont les clés étaient les langues et la valeur le nombre de tweets dans cette langue.

Dans cet exercice, nous allons généraliser l’analyse de langage Twitter que vous avez effectuée dans le chapitre précédent. Pour ce faire, vous devez inclure un argument par défaut qui prend le nom d’une colonne.

Pour aller plus vite, pandas a été importé en tant que pd et le fichier 'tweets.csv' a été importé dans le DataFrame tweets_df. Des morceaux de code de votre travail précédent sont également fournis.

Cet exercice fait partie du cours

Introduction aux fonctions en Python

Afficher le cours

Instructions

  • Complétez l’en-tête de la fonction en fournissant le paramètre pour un DataFrame df et le paramètre col_name avec une valeur par défaut de 'lang' pour le nom de la colonne du DataFrame.
  • Appelez count_entries() en lui transmettant le DataFrame tweets_df et le nom de la colonne 'lang'. Affectez le résultat à result1. Notez que puisque 'lang' est la valeur par défaut du paramètre col_name, vous n’avez pas besoin de la spécifier ici.
  • Appelez count_entries() en lui transmettant le DataFrame tweets_df et le nom de la colonne 'source'. Affectez le résultat à result2.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Define count_entries()
def count_entries(____, ____):
    """Return a dictionary with counts of
    occurrences as value for each key."""

    # Initialize an empty dictionary: cols_count
    cols_count = {}

    # Extract column from DataFrame: col
    col = df[col_name]
    
    # Iterate over the column in DataFrame
    for entry in col:

        # If entry is in cols_count, add 1
        if entry in cols_count.keys():
            cols_count[entry] += 1

        # Else add the entry to cols_count, set the value to 1
        else:
            cols_count[entry] = 1

    # Return the cols_count dictionary
    return cols_count

# Call count_entries(): result1
result1 = ____

# Call count_entries(): result2
result2 = ____

# Print result1 and result2
print(result1)
print(result2)
Modifier et exécuter le code