Charger toutes les données de cotation et itérer sur des paires clé–valeur d’un dictionnaire
Vous savez déjà qu’un objet pd.DataFrame() est une structure de données étiquetées à deux dimensions. Comme vous l’avez vu dans la vidéo, la fonction pd.concat() permet de concaténer, c’est‑à‑dire de combiner verticalement, deux DataFrames ou plus. Vous pouvez également utiliser le broadcasting pour ajouter de nouvelles colonnes aux DataFrames.
Dans cet exercice, vous allez vous entraîner à utiliser cette fonction pandas avec les données des bourses NYSE et NASDAQ. pandas a été importé sous l’alias pd.
Cet exercice fait partie du cours
Importer et gérer des données financières en Python
Instructions
- Importez les données du fichier
listings.xlsxdepuis les feuilles'nyse'et'nasdaq'dans les variablesnyseetnasdaq. Interprétez'n/a'comme valeur manquante. - Inspectez le contenu des deux DataFrames avec
.info()pour savoir combien d’entreprises sont recensées. - À l’aide du broadcasting, créez une nouvelle colonne de référence appelée
'Exchange'contenant les valeurs'NYSE'ou'NASDAQ'pour chaque DataFrame. - Utilisez
pd.concat()pour concaténer les DataFramesnyseetnasdaq, dans cet ordre, et affectez le résultat àcombined_listings.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import the NYSE and NASDAQ listings
nyse = pd.____('listings.xlsx', ____='nyse', na_values='n/a')
nasdaq = pd.____('listings.xlsx', ____='nasdaq', na_values='n/a')
# Inspect nyse and nasdaq
nyse.____()
nasdaq.____()
# Add Exchange reference columns
nyse['____'] = 'NYSE'
nasdaq['____'] = 'NASDAQ'
# Concatenate DataFrames
combined_listings = pd.____([____, ____])