Toutes les statistiques descriptives par secteur

Vous pouvez appliquer les différentes statistiques descriptives vues au chapitre précédent à un objet groupby pour obtenir des résultats par catégorie. Cela inclut la fonction .describe(), qui fournit plusieurs indicateurs en une seule fois !

Ici, vous allez vous entraîner avec les sociétés cotées au NASDAQ. pandas a été importé sous le nom pd, et les données des sociétés cotées sur le NASDAQ sont disponibles dans votre espace de travail dans le DataFrame nasdaq.

Cet exercice fait partie du cours

<cours>Importer et gérer des données financières en Python</cours>

Voir le cours

Instructions de l’exercice

Inspectez les données nasdaq avec .info().
Créez une nouvelle colonne market_cap_m contenant la capitalisation boursière en millions de dollars (USD). À la ligne suivante, supprimez la colonne 'Market Capitalization'.
Regroupez vos données nasdaq par 'Sector' et assignez le résultat à nasdaq_by_sector.
Appelez la méthode .describe() sur nasdaq_by_sector, assignez le résultat à summary, puis affichez-le.
Cela fonctionne, mais summary est au format long et utilise un pd.MultiIndex() que vous avez déjà vu. Convertissez summary au format large en appelant .unstack().

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Inspect NASDAQ data
nasdaq.____()

# Create market_cap_m
nasdaq['market_cap_m'] = ____[____].div(1e6)

# Drop the Market Capitalization column
nasdaq.drop('Market Capitalization', axis=1, inplace=True)

# Group nasdaq by Sector
nasdaq_by_sector = ____.____(____)

# Create summary statistics by sector
summary = ____.____()

# Print the summary
print(summary)

# Unstack 
summary = ____.____()

# Print the summary again
print(summary)

Modifier et exécuter le code