Mediana da capitalização de mercado por setor
Dados agregados são dados combinados a partir de várias medições. Como você viu no vídeo, a função .groupby() ajuda a agregar seus dados por uma categoria específica.
Você já viu que os dados de capitalização de mercado têm grandes outliers. Para obter um resumo mais robusto do valor de mercado das empresas em cada setor, você vai calcular a mediana da capitalização de mercado por setor. pandas como pd e matplotlib.pyplot como plt já foram importados, e a lista de empresas da bolsa NYSE está disponível no seu workspace como o DataFrame nyse.
Este exercício faz parte do curso
Importing and Managing Financial Data in Python
Instruções do exercício
- Inspecione
nyseusando.info(). - Com broadcasting e
.div(), crie uma nova colunamarket_cap_mque contenha a capitalização de mercado em milhões de USD. - Omita a coluna
'Market Capitalization'com.drop(). - Aplique o método
.groupby()anyse, usando'Sector'como a coluna para agrupar seus dados. - Calcule a mediana da coluna
market_cap_mcomomedian_mcap_by_sector. - Plote o resultado como um gráfico de barras horizontal com o título
'NYSE - Median Market Capitalization'. Useplt.xlabel()com'USD mn'para adicionar um rótulo. - Mostre o resultado.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Inspect NYSE data
nyse.____()
# Create market_cap_m
nyse['market_cap_m'] = ____[____].div(1e6)
# Drop market cap column
nyse = ____.____('Market Capitalization', axis=1)
# Group nyse by sector
mcap_by_sector = ____.____(____)
# Calculate median
median_mcap_by_sector = mcap_by_sector.____.____()
# Plot and show as horizontal bar chart
median_mcap_by_sector.plot(____=____, title='NYSE - Median Market Capitalization')
# Add the label
plt.____('USD mn')
# Show the plot
plt.show()