On mélange tout (1)
Rappelez-vous l’exercice On mélange tout dans le chapitre précédent où vous avez effectué une analyse simple de Twitter en développant une fonction qui compte le nombre de tweets dans certaines langues. La sortie de votre fonction était un dictionnaire dont les clés étaient les langues et la valeur le nombre de tweets dans cette langue.
Dans cet exercice, nous allons généraliser l’analyse de langage Twitter que vous avez effectuée dans le chapitre précédent. Pour ce faire, vous devez inclure un argument par défaut qui prend le nom d’une colonne.
Pour aller plus vite, pandas
a été importé en tant que pd
et le fichier 'tweets.csv'
a été importé dans le DataFrame tweets_df
. Des morceaux de code de votre travail précédent sont également fournis.
Cet exercice fait partie du cours
Introduction aux fonctions en Python
Instructions
- Complétez l’en-tête de la fonction en fournissant le paramètre pour un DataFrame
df
et le paramètrecol_name
avec une valeur par défaut de'lang'
pour le nom de la colonne du DataFrame. - Appelez
count_entries()
en lui transmettant le DataFrametweets_df
et le nom de la colonne'lang'
. Affectez le résultat àresult1
. Notez que puisque'lang'
est la valeur par défaut du paramètrecol_name
, vous n’avez pas besoin de la spécifier ici. - Appelez
count_entries()
en lui transmettant le DataFrametweets_df
et le nom de la colonne'source'
. Affectez le résultat àresult2
.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Define count_entries()
def count_entries(____, ____):
"""Return a dictionary with counts of
occurrences as value for each key."""
# Initialize an empty dictionary: cols_count
cols_count = {}
# Extract column from DataFrame: col
col = df[col_name]
# Iterate over the column in DataFrame
for entry in col:
# If entry is in cols_count, add 1
if entry in cols_count.keys():
cols_count[entry] += 1
# Else add the entry to cols_count, set the value to 1
else:
cols_count[entry] = 1
# Return the cols_count dictionary
return cols_count
# Call count_entries(): result1
result1 = ____
# Call count_entries(): result2
result2 = ____
# Print result1 and result2
print(result1)
print(result2)