Découper le prix de location
Dans l’exercice en vidéo, vous avez vu comment utiliser pandas pour découper la colonne d’adresses e-mail de la table film afin d’extraire les noms de domaine des utilisateurs. Supposons que vous souhaitiez mieux comprendre les tarifs payés par les utilisateurs pour les films : vous décidez donc de diviser la colonne rental_rate en dollars et en cents.
Dans cet exercice, vous allez réutiliser les mêmes techniques que dans les vidéos pour faire exactement cela ! La table film a été chargée dans le DataFrame pandas film_df. Rappelez-vous, l’objectif est de scinder la colonne rental_rate en dollars et en cents.
Cet exercice fait partie du cours
Introduction au data engineering
Instructions
- Utilisez la méthode
.astype()pour convertir la colonnerental_rateen une colonne d’objets chaîne, et affectez le résultat àrental_rate_str. - Séparez
rental_rate_strsur'.'et étendez le résultat en colonnes. Affectez le résultat àrental_rate_expanded. - Affectez les nouvelles colonnes à
films_dfen utilisant respectivement les nomsrental_rate_dollaretrental_rate_cents, en les définissant sur la version « étendue » à l’aide de l’index approprié.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Get the rental rate column as a string
rental_rate_str = film_df.____.____("____")
# Split up and expand the column
rental_rate_expanded = rental_rate_str.____.____("____", expand=True)
# Assign the columns to film_df
film_df = film_df.assign(
____=____[____],
____=____[____],
)