Explorer et nettoyer les informations d’introduction en bourse des entreprises
Pour démarrer la construction d’un indice pondéré par la valeur de marché, vous allez travailler avec les informations d’inscription combinées des trois plus grandes bourses américaines : le NYSE, le NASDAQ et l’AMEX.
Dans cet exercice et le suivant, vous calculerez les pondérations par capitalisation boursière pour ces actions.
Nous avons déjà importé pandas sous le nom pd, et chargé le jeu de données listings contenant les informations d’inscription du NYSE, du NASDAQ et de l’AMEX. La colonne 'Market Capitalization' est déjà exprimée en millions USD.
Cet exercice fait partie du cours
Manipuler des séries temporelles en Python
Instructions
- Inspectez
listingsavec.info(). - Placez la colonne
'Stock Symbol'dans l’index (inplace). - Supprimez de
listingstoutes les entreprises dont l’information'Sector'est manquante. - Sélectionnez les entreprises dont l’année d’IPO est antérieure à 2019.
- Inspectez le résultat des modifications avec
.info(). - Affichez le nombre d’entreprises par
'Sector'avec.groupby()et.size(). Triez la sortie par ordre décroissant.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Inspect listings
print(____)
# Move 'stock symbol' into the index
# Drop rows with missing 'sector' data
# Select companies with IPO Year before 2019
listings = ____
# Inspect the new listings data
print(____)
# Show the number of companies per sector
print(____)