CommencerCommencer gratuitement

Préparer les données pour l’analyse des paniers

Tout au long de ce cours, vous rencontrerez généralement les données sous l’un de deux formats : un DataFrame pandas ou une liste de listes. Les objets DataFrame seront construits en important un fichier csv avec pandas. Ils comprendront une seule colonne de données, où chaque élément contient une chaîne d’articles d’une transaction, séparés par des virgules, comme dans le tableau ci-dessous.

Dans cet exercice, vous allez vous entraîner à charger les données depuis un fichier csv et à les préparer pour les utiliser sous forme de liste de listes. Notez que le chemin vers le jeu de données de l’épicerie a été défini et est disponible sous groceries_path.

Transaction
'milk,bread,biscuit'
'bread,milk,biscuit,cereal'
'tea,milk,coffee,cereal'

Cet exercice fait partie du cours

Analyse des paniers d’achat en Python

Afficher le cours

Instructions

  • Importez le paquet pandas sous l’alias pd.
  • Utilisez pandas pour lire le fichier csv au chemin indiqué par groceries_path.
  • Sélectionnez la colonne Transaction du DataFrame et scindez chaque chaîne d’articles séparés par des virgules en une liste.
  • Convertissez le DataFrame de transactions en une liste de listes.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import pandas under the alias pd
import ____ as pd

# Load transactions from pandas
groceries = pd.____(groceries_path)

# Split transaction strings into lists
transactions = groceries['____'].apply(lambda t: t.split(','))

# Convert DataFrame column into list of strings
transactions = list(____)

# Print the list of transactions
print(transactions)
Modifier et exécuter le code