ComenzarEmpieza gratis

Mediana de la capitalización bursátil por sector

Los datos agregados son datos combinados a partir de varias mediciones. Como viste en el vídeo, la función .groupby() es útil para agregar tus datos por una categoría específica.

Ya viste que los datos de capitalización bursátil tienen valores atípicos muy grandes. Para obtener un resumen más robusto del valor de mercado de las empresas en cada sector, vas a calcular la mediana de la capitalización por sector. pandas como pd y matplotlib.pyplot como plt ya se han importado, y los listados del mercado NYSE están disponibles en tu espacio de trabajo como el DataFrame nyse.

Este ejercicio forma parte del curso

Importación y gestión de datos financieros en Python

Ver curso

Instrucciones del ejercicio

  • Inspecciona nyse usando .info().
  • Con difusión (broadcasting) y .div(), crea una nueva columna market_cap_m que contenga la capitalización bursátil en millones de USD.
  • Omite la columna 'Market Capitalization' con .drop().
  • Aplica el método .groupby() a nyse, usando 'Sector' como la columna por la que agrupar.
  • Calcula la mediana de la columna market_cap_m como median_mcap_by_sector.
  • Representa el resultado como un gráfico de barras horizontal con el título 'NYSE - Median Market Capitalization'. Usa plt.xlabel() con 'USD mn' para añadir una etiqueta.
  • Muestra el resultado.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Inspect NYSE data
nyse.____()

# Create market_cap_m
nyse['market_cap_m'] = ____[____].div(1e6)

# Drop market cap column
nyse = ____.____('Market Capitalization', axis=1)

# Group nyse by sector
mcap_by_sector = ____.____(____)

# Calculate median
median_mcap_by_sector = mcap_by_sector.____.____()

# Plot and show as horizontal bar chart
median_mcap_by_sector.plot(____=____, title='NYSE - Median Market Capitalization')

# Add the label
plt.____('USD mn')

# Show the plot
plt.show()
Editar y ejecutar código