À vous de lire, Katniss !
La journée de travail touche à sa fin. Mais avant de partir, vous voulez faire une petite analyse pour le plaisir. Vous allez analyser un autre jeu de données de livres, cette fois sur la série Hunger Games.
Vous avez exploré le jeu de données books_hunger avant de le remodeler, mais quelque chose clochait. L’index du DataFrame contient le titre des livres. Vous savez que vous ne pouvez pas le remodeler dans ce format. Sinon, vous perdriez une information précieuse, le titre ; vous devez donc faire quelques modifications avant de transformer le DataFrame.
Le jeu de données books_hunger est à votre disposition. Il contient le title ainsi que des informations sur la language, la publication date, la publication number et la page number de chaque livre.
Cet exercice fait partie du cours
Reconfigurer les données avec pandas
Instructions
- Modifiez le DataFrame
books_hungeren réinitialisant l’index sans le supprimer. - Transformez
books_hungerdu format large au format long. Utilisez les colonnestitleetlanguagecomme index uniques. Nommezfeaturela nouvelle variable créée à partir des colonnes qui commencent parpublicationetpage. Ces colonnes sont séparées par un espace et se terminent par un mot.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Modify books_hunger by resetting the index without dropping it
books_hunger.____(____=____, inplace=____)
# Reshape using title and language as index, feature as new name, publication and page as prefix separated by space and ending in a word
publication_features = pd.wide_to_long(____,
____=____,
____=____,
____=____,
____=____,
____=____)
# Print publication_features
print(publication_features)