Mediana de la capitalización bursátil por sector
Los datos agregados son datos combinados a partir de varias mediciones. Como viste en el vídeo, la función .groupby() es útil para agregar tus datos por una categoría específica.
Ya viste que los datos de capitalización bursátil tienen valores atípicos muy grandes. Para obtener un resumen más robusto del valor de mercado de las empresas en cada sector, vas a calcular la mediana de la capitalización por sector. pandas como pd y matplotlib.pyplot como plt ya se han importado, y los listados del mercado NYSE están disponibles en tu espacio de trabajo como el DataFrame nyse.
Este ejercicio forma parte del curso
Importación y gestión de datos financieros en Python
Instrucciones del ejercicio
- Inspecciona
nyseusando.info(). - Con difusión (broadcasting) y
.div(), crea una nueva columnamarket_cap_mque contenga la capitalización bursátil en millones de USD. - Omite la columna
'Market Capitalization'con.drop(). - Aplica el método
.groupby()anyse, usando'Sector'como la columna por la que agrupar. - Calcula la mediana de la columna
market_cap_mcomomedian_mcap_by_sector. - Representa el resultado como un gráfico de barras horizontal con el título
'NYSE - Median Market Capitalization'. Usaplt.xlabel()con'USD mn'para añadir una etiqueta. - Muestra el resultado.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Inspect NYSE data
nyse.____()
# Create market_cap_m
nyse['market_cap_m'] = ____[____].div(1e6)
# Drop market cap column
nyse = ____.____('Market Capitalization', axis=1)
# Group nyse by sector
mcap_by_sector = ____.____(____)
# Calculate median
median_mcap_by_sector = mcap_by_sector.____.____()
# Plot and show as horizontal bar chart
median_mcap_by_sector.plot(____=____, title='NYSE - Median Market Capitalization')
# Add the label
plt.____('USD mn')
# Show the plot
plt.show()