1. Learn
  2. /
  3. Courses
  4. /
  5. Introduction aux fonctions en Python

Connected

Exercise

Rassembler le tout (1)

Vous avez eu un premier aperçu de l'écriture de vos propres fonctions dans les exercices précédents. Vous avez appris à ajouter des paramètres à vos définitions de fonctions, à retourner une valeur ou plusieurs valeurs avec des tuples, et à appeler les fonctions que vous avez définies.

Dans cet exercice et le suivant, vous allez rassembler toutes ces notions et les appliquer à un simple problème de science des données. Vous allez charger un jeu de données et développer des fonctionnalités pour en dégager de petites informations.

Pour cet exercice, votre objectif est de vous rappeler comment charger un jeu de données dans un DataFrame. Le jeu de données contient des données Twitter et vous allez parcourir les entrées d'une colonne pour construire un dictionnaire où les clés sont les noms des langues et les valeurs correspondent au nombre de tweets dans la langue donnée. Le fichier tweets.csv est disponible dans votre répertoire actuel.

Soyez conscient qu'il s'agit de vraies données provenant de Twitter et qu'il y a donc toujours un risque qu'elles contiennent des blasphèmes ou d'autres contenus répréhensibles (dans cet exercice, ainsi que dans tout exercice suivant qui utilise aussi de vraies données de Twitter).

Instructions

100 XP
  • Importez le paquet pandas avec l'alias pd.
  • Importez le fichier 'tweets.csv' à l'aide de la fonction pandas read_csv(). Assignez le DataFrame obtenu à df.
  • Complétez la boucle for en itérant sur col, la colonne 'lang' du DataFrame df.
  • Complétez les blocs if-else dans la boucle : si la clé est dans le dictionnaire langs_count, ajoutez 1 à la valeur correspondante dans le dictionnaire, sinon ajoutez la clé à langs_count et définissez la valeur correspondante à 1. Utilisez la variable de boucle entry dans votre code.