Effectuer des calculs avec pandas
Un fichier CSV appelé sales.csv
vous a été fourni, il contient des données de vente avec trois colonnes : "user_id"
, "date"
, et "order_value"
.
À l'aide de pandas
, vous lirez le fichier et calculerez des statistiques sur les valeurs de vente.
Tout comme vous pouvez subdiviser un dictionnaire par sa clé, par exemple dictionary["key_name"]
, vous pouvez utiliser la même syntaxe dans pandas
pour subdiviser une colonne. De plus, le package fournit également des méthodes utiles pour effectuer des calculs sur des DataFrames ou des sous-ensembles de DataFrames (comme les colonnes).
Les exemples de cette syntaxe sont df["column_name"].mean()
et df["column_name"].sum()
pour calculer respectivement la moyenne et le total d'une colonne donnée.
Cet exercice fait partie du cours
Python intermédiaire pour les développeurs
Instructions
- Lisez le contenu de
"sales.csv"
, en l'enregistrant sous la forme d'un DataFrame pandas appelésales_df
. - Créez un sous-ensemble de
sales_df
sur la colonne"order_value"
, puis appelez la méthode.mean()
pour trouver la valeur de la commande moyenne. - Créez un sous-ensemble de
sales_df
sur la colonne"order_value"
, puis appelez la méthode.sum()
pour trouver la valeur totale de toutes les commandes.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Read in sales.csv
sales_df = ____.____("____")
# Print the mean order_value
print(sales_df["____"].____())
# Print the total value of sales
print(sales_df["____"].____())