CommencerCommencer gratuitement

Chargement des données de vente dans un fichier CSV

Le chargement des données est un élément essentiel de tout pipeline de données. Il garantit que les consommateurs de données et les processus ont un accès fiable aux données que vous avez extraites et transformées plus tôt dans un pipeline. Dans cet exercice, vous vous entraînerez à charger des données de vente transformées dans un fichier CSV à l'aide de pandas, qui a été importé en tant que pd. En outre, les données brutes ont été extraites et sont disponibles dans le DataFrame raw_sales_data.

Cet exercice fait partie du cours

ETL et ELT en Python

Afficher le cours

Instructions

  • Filtrez le DataFrame raw_sales_data pour ne conserver que les articles dont le prix est inférieur à 25 dollars.
  • Mettez à jour la fonction load() pour écrire les données de vente transformées dans un fichier nommé "transformed_sales_data.csv", en veillant à ne pas inclure la colonne index.
  • Appelez la fonction load() sur le cadre de données nettoyé.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

def transform(raw_data):
	# Find the items prices less than 25 dollars
	return raw_data.loc[raw_data["Price Each"] ____ ____, ["Order ID", "Product", "Price Each", "Order Date"]]

def load(clean_data):
	# Write the data to a CSV file without the index column
	____.____("transformed_sales_data.csv", index=____)


clean_sales_data = transform(raw_sales_data)

# Call the load function on the cleaned DataFrame
____(____)
Modifier et exécuter le code