Empresas por sector en todos los mercados
Una variable categórica es una variable que toma uno de un número limitado de valores en función de alguna característica cualitativa. Una distribución de frecuencias representa cuántas veces aparece cada valor de una variable categórica.
Piensa en los datos de bolsa de los capítulos anteriores. La función .mean() no es muy útil para entender la frecuencia de valores de 'Sector' como 'Technology' y 'Finance', mientras que .value_counts() y .nunique() sí lo son.
En este ejercicio, compararás la distribución de empresas en AMEX, NASDAQ y NYSE por sector. pandas como pd y matplotlib.pyplot como plt ya se han importado, y la información de cotizadas de ejercicios anteriores se ha cargado en un diccionario listings cuyas claves son 'amex', 'nasdaq' y 'nyse'.
Este ejercicio forma parte del curso
Importación y gestión de datos financieros en Python
Instrucciones del ejercicio
- Crea una lista
exchangesque contenga exactamente las cadenas con los nombres de los mercados en el orden indicado arriba. - Usa un bucle for para iterar sobre
exchangescon una variable iteradoraexchangeque contenga el nombre de cada mercado. En cada iteración:- Aplica
.value_counts()a'Sector'y asigna el resultado asectors. - Ordena
sectorsen orden descendente y represéntalo en un gráfico de barras. - Muestra el resultado.
- Aplica
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create the list exchanges
exchanges = [____, ____, ____]
# Iterate over exchanges then plot and show result
for ____ in exchanges:
sectors = listings[____].____.____()
# Sort in descending order and plot
sectors.sort_values(____=____).plot(____=____)
# Show the plot
plt.show()