CommencerCommencer gratuitement

Découper le prix de location

Dans l’exercice en vidéo, vous avez vu comment utiliser pandas pour découper la colonne d’adresses e-mail de la table film afin d’extraire les noms de domaine des utilisateurs. Supposons que vous souhaitiez mieux comprendre les tarifs payés par les utilisateurs pour les films : vous décidez donc de diviser la colonne rental_rate en dollars et en cents.

Dans cet exercice, vous allez réutiliser les mêmes techniques que dans les vidéos pour faire exactement cela ! La table film a été chargée dans le DataFrame pandas film_df. Rappelez-vous, l’objectif est de scinder la colonne rental_rate en dollars et en cents.

Cet exercice fait partie du cours

Introduction au data engineering

Afficher le cours

Instructions

  • Utilisez la méthode .astype() pour convertir la colonne rental_rate en une colonne d’objets chaîne, et affectez le résultat à rental_rate_str.
  • Séparez rental_rate_str sur '.' et étendez le résultat en colonnes. Affectez le résultat à rental_rate_expanded.
  • Affectez les nouvelles colonnes à films_df en utilisant respectivement les noms rental_rate_dollar et rental_rate_cents, en les définissant sur la version « étendue » à l’aide de l’index approprié.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Get the rental rate column as a string
rental_rate_str = film_df.____.____("____")

# Split up and expand the column
rental_rate_expanded = rental_rate_str.____.____("____", expand=True)

# Assign the columns to film_df
film_df = film_df.assign(
    ____=____[____],
    ____=____[____],
)
Modifier et exécuter le code