Chargement des données de vente dans un fichier CSV
Le chargement des données est un élément essentiel de tout pipeline de données. Il garantit que les consommateurs de données et les processus ont un accès fiable aux données que vous avez extraites et transformées plus tôt dans un pipeline. Dans cet exercice, vous vous entraînerez à charger des données de vente transformées dans un fichier CSV à l'aide de pandas
, qui a été importé en tant que pd
. En outre, les données brutes ont été extraites et sont disponibles dans le DataFrame raw_sales_data
.
Cet exercice fait partie du cours
ETL et ELT en Python
Instructions
- Filtrez le DataFrame
raw_sales_data
pour ne conserver que les articles dont le prix est inférieur à 25 dollars. - Mettez à jour la fonction
load()
pour écrire les données de vente transformées dans un fichier nommé"transformed_sales_data.csv"
, en veillant à ne pas inclure la colonneindex
. - Appelez la fonction
load()
sur le cadre de données nettoyé.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
def transform(raw_data):
# Find the items prices less than 25 dollars
return raw_data.loc[raw_data["Price Each"] ____ ____, ["Order ID", "Product", "Price Each", "Order Date"]]
def load(clean_data):
# Write the data to a CSV file without the index column
____.____("transformed_sales_data.csv", index=____)
clean_sales_data = transform(raw_sales_data)
# Call the load function on the cleaned DataFrame
____(____)