CommencerCommencer gratuitement

Calculer plusieurs indicateurs par secteur et par place boursière

La fonction .agg() vous permet d’agréger vos données de multiples façons. En passant une liste de noms de méthodes statistiques, vous calculez plusieurs statistiques de synthèse en une seule fois. Vous pouvez donner de nouveaux noms aux colonnes agrégées avec la méthode rename, qui prend en argument un dictionnaire où les clés sont les noms des mesures calculées et les valeurs sont les nouveaux noms souhaités.

Dans cet exercice, vous allez calculer la moyenne, la médiane et l’écart type des capitalisations boursières en millions de dollars américains. pandas sous le nom pd et matplotlib.pyplot sous le nom plt ont été importés, et le DataFrame listings, avec la colonne de référence 'Exchange', est disponible dans votre espace de travail.

Cet exercice fait partie du cours

Importer et gérer des données financières en Python

Afficher le cours

Instructions

  • À l’aide du broadcasting et de .div(), créez une nouvelle colonne 'marketcapm' contenant la capitalisation boursière en millions de dollars américains.
  • Regroupez vos données à la fois par 'Sector' et par 'Exchange', et affectez le résultat à bysectorexchange.
  • Affectez la colonne marketcapm de bysectorexchange à une variable bse_mcm.
  • Utilisez .agg() pour calculer la moyenne, la médiane et l’écart type de marketcapm, puis appelez la méthode rename avec un dictionnaire pour le paramètre columns afin d’enregistrer les résultats sous 'Average', 'Median' et 'Standard Deviation', respectivement, et affectez le tout à summary.
  • Affichez le résultat dans votre console.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create market_cap_m
listings['market_cap_m'] = ____[____].div(1e6)

# Group listing by both Sector and Exchange
by_sector_exchange = ____.____(['Sector', 'Exchange'])

# Subset market_cap_m of by_sector_exchange
bse_mcm = ____[____]

# Calculate mean, median, and std in summary
summary = ____.____(['____', '____', '____']).rename(columns={'mean': ____, 'median': ____, 'std':____})

# Print the summary
print(summary)
Modifier et exécuter le code