Calcula varias métricas por sector y mercado
La función .agg() te permite agregar tus datos de muchas más formas. Si pasas una lista con nombres de métodos estadísticos, calcularás varias estadísticas de resumen a la vez. Puedes proporcionar nombres nuevos para las columnas agregadas usando el método rename, que recibe un diccionario donde las claves son los nombres de las métricas que calculas y los valores son los nuevos nombres que quieres.
En este ejercicio, vas a calcular la media, la mediana y la desviación estándar de las capitalizaciones bursátiles en millones de USD. pandas como pd y matplotlib.pyplot como plt ya se han importado, y el DataFrame listings, con la columna de referencia 'Exchange', está disponible en tu espacio de trabajo.
Este ejercicio forma parte del curso
Importación y gestión de datos financieros en Python
Instrucciones del ejercicio
- Con broadcasting y
.div(), crea una nueva columna'market_cap_m'que contenga la capitalización bursátil en millones de USD. - Agrupa tus datos por
'Sector'y'Exchange', asignando el resultado aby_sector_exchange. - Asigna la columna
market_cap_mdeby_sector_exchangea una variablebse_mcm. - Usa
.agg()para calcular la media, la mediana y la desviación estándar demarket_cap_m, y llama al método rename con un diccionario para el parámetro con nombrecolumns, almacenando los resultados en'Average','Median'y'Standard Deviation', respectivamente, y asigna asummary. - Imprime el resultado en la consola.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create market_cap_m
listings['market_cap_m'] = ____[____].div(1e6)
# Group listing by both Sector and Exchange
by_sector_exchange = ____.____(['Sector', 'Exchange'])
# Subset market_cap_m of by_sector_exchange
bse_mcm = ____[____]
# Calculate mean, median, and std in summary
summary = ____.____(['____', '____', '____']).rename(columns={'mean': ____, 'median': ____, 'std':____})
# Print the summary
print(summary)