Calcula varias métricas por sector y año de IPO
La función pointplot() de seaborn facilita la comparación de estadísticas resumen de una variable numérica para distintos niveles de variables categóricas:
seaborn.pointplot(x=None, y=None, hue=None, data=None, ...)
En el vídeo, viste una visualización de la capitalización bursátil (la variable numérica) diferenciada por si la IPO (la variable categórica) ocurrió antes (primer nivel) o después (segundo nivel) del año 2000.
En este ejercicio, compararás la capitalización bursátil media para cada año desde 2000 para la NYSE y el NASDAQ, tras excluir valores atípicos por encima del percentil 95. pandas como pd y matplotlib.pyplot como plt ya se han importado, y el DataFrame listings con la columna de referencia 'Exchange' está disponible en tu espacio de trabajo.
Este ejercicio forma parte del curso
Importación y gestión de datos financieros en Python
Instrucciones del ejercicio
- Importa
seaborncomosns. - Filtra
listingspara quedarte con empresas con IPO posteriores a 2000 de todos los mercados, excepto'amex'. - Convierte los datos de la columna
'IPO Year'a enteros. - Crea la columna
market_cap_mpara expresar la capitalización en millones de USD. - Filtra
market_cap_mpara excluir los valores por encima del percentil 95. - Crea un
pointplotdelistingsusando la columna'IPO Year'parax,'market_cap_m'parayy'Exchange'parahue. Muestra el resultado tras rotar lasxticks45 grados.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import the seaborn library as sns
____
# Exclude IPOs before 2000 and from the 'amex'
listings = ____[(____['IPO Year'] > ____) & (listings.Exchange != ____)]
# Convert IPO Year to integer
listings['IPO Year'] = ____['IPO Year'].____(____)
# Create market_cap_m
listings['market_cap_m'] = ____['Market Capitalization'].div(1e6)
# Exclude outliers
listings = listings[listings.____ < listings.____.____(.95)]
# Create the pointplot
sns.pointplot(x=____, y=____, hue=____, data=____)
# Rotate xticks
plt.____(____=____)
# Show the plot
plt.show()