Capitalisation boursière médiane par secteur
Les données agrégées sont des données combinées à partir de plusieurs mesures. Comme vous l’avez vu dans la vidéo, la fonction .groupby() est utile pour agréger vos données selon une catégorie donnée.
Vous avez déjà constaté que les données de capitalisation boursière contiennent de fortes valeurs aberrantes. Pour obtenir un résumé plus robuste de la valeur de marché des entreprises par secteur, vous allez calculer la capitalisation boursière médiane par secteur. pandas sous l’alias pd et matplotlib.pyplot sous l’alias plt ont été importés, et la liste des sociétés cotées au NYSE est disponible dans votre espace de travail sous forme de DataFrame nyse.
Cet exercice fait partie du cours
Importer et gérer des données financières en Python
Instructions
- Inspectez
nyseavec.info(). - À l’aide du broadcasting et de
.div(), créez une nouvelle colonnemarket_cap_mqui contient la capitalisation boursière en millions d’USD. - Supprimez la colonne
'Market Capitalization'avec.drop(). - Appliquez la méthode
.groupby()ànyse, en utilisant'Sector'comme colonne de regroupement. - Calculez la médiane de la colonne
market_cap_msous le nommedian_mcap_by_sector. - Tracez le résultat sous forme d’histogramme horizontal avec le titre
'NYSE - Median Market Capitalization'. Utilisezplt.xlabel()avec'USD mn'pour ajouter un libellé. - Affichez le résultat.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Inspect NYSE data
nyse.____()
# Create market_cap_m
nyse['market_cap_m'] = ____[____].div(1e6)
# Drop market cap column
nyse = ____.____('Market Capitalization', axis=1)
# Group nyse by sector
mcap_by_sector = ____.____(____)
# Calculate median
median_mcap_by_sector = mcap_by_sector.____.____()
# Plot and show as horizontal bar chart
median_mcap_by_sector.plot(____=____, title='NYSE - Median Market Capitalization')
# Add the label
plt.____('USD mn')
# Show the plot
plt.show()