Elémentaire, mon cher Watson !
Nous sommes vendredi et vous êtes sur le point de terminer votre projet de livre. Pour votre dernière tâche, vous allez analyser des données sur les livres d’Arthur Conan Doyle.
Vous constatez que votre jeu de données, books_sh, doit être remanié. Vous remarquez qu’il existe des colonnes pouvant être regroupées à l’aide d’un préfixe. Vous identifiez les colonnes à utiliser comme identifiants uniques. Toutefois, certaines de ces colonnes contiennent des chaînes de caractères. Elles nécessitent quelques manipulations avant d’appliquer une transformation du format large au format long. Vous décidez de scinder certaines chaînes pour rendre le DataFrame plus propre.
Le jeu de données books_sh est à votre disposition. Il contient le title et des informations sur la version, le number_pages et le number_ratings de chaque livre.
Cet exercice fait partie du cours
Reconfigurer les données avec pandas
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Split main_title by a colon and assign it to two columns named title and subtitle
books_sh[['title', 'subtitle']] = ____[____].____.____(____, ____=____)
# Print books_sh
print(books_sh)