Calcule várias métricas por setor e ano de IPO
A função pointplot() do seaborn facilita a comparação de estatísticas-resumo de uma variável numérica entre diferentes níveis de variáveis categóricas:
seaborn.pointplot(x=None, y=None, hue=None, data=None, ...)
No vídeo, você viu uma visualização da capitalização de mercado (a variável numérica) diferenciada por o IPO (a variável categórica) ter ocorrido antes (primeiro nível) ou depois (segundo nível) do ano 2000.
Neste exercício, você vai comparar a capitalização de mercado média para cada ano desde 2000 para a NYSE e a NASDAQ, após excluir outliers acima do percentil 95. pandas como pd e matplotlib.pyplot como plt já foram importados, e o DataFrame listings com a coluna de referência 'Exchange' está disponível no seu workspace.
Este exercício faz parte do curso
Importing and Managing Financial Data in Python
Instruções do exercício
- Importe
seaborncomosns. - Filtre
listingspara manter empresas com IPOs após 2000 de todas as bolsas, exceto a'amex'. - Converta os dados da coluna
'IPO Year'para inteiros. - Crie a coluna
market_cap_mpara expressar a capitalização de mercado em milhões de USD. - Filtre
market_cap_mpara excluir valores acima do percentil 95. - Crie um
pointplotdelistingsusando a coluna'IPO Year'emx,'market_cap_m'emye'Exchange'emhue. Mostre o resultado após rotacionar osxticksem 45 graus.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import the seaborn library as sns
____
# Exclude IPOs before 2000 and from the 'amex'
listings = ____[(____['IPO Year'] > ____) & (listings.Exchange != ____)]
# Convert IPO Year to integer
listings['IPO Year'] = ____['IPO Year'].____(____)
# Create market_cap_m
listings['market_cap_m'] = ____['Market Capitalization'].div(1e6)
# Exclude outliers
listings = listings[listings.____ < listings.____.____(.95)]
# Create the pointplot
sns.pointplot(x=____, y=____, hue=____, data=____)
# Rotate xticks
plt.____(____=____)
# Show the plot
plt.show()