Empresas por setor em todas as bolsas
Uma variável categórica é uma variável que assume um número limitado de valores com base em alguma característica qualitativa. Uma distribuição de frequências representa quantas vezes cada valor de uma variável categórica ocorre.
Pense novamente nos dados das bolsas dos capítulos anteriores. A função .mean() não ajuda muito a entender a frequência dos valores de 'Sector', como 'Technology' e 'Finance', enquanto .value_counts() e .nunique() ajudam.
Neste exercício, você vai comparar a distribuição de listagens na AMEX, NASDAQ e NYSE por setor. pandas como pd e matplotlib.pyplot como plt já foram importados, e as informações de listagens dos exercícios anteriores foram carregadas em um dicionário listings cujas chaves são 'amex', 'nasdaq' e 'nyse'.
Este exercício faz parte do curso
Importing and Managing Financial Data in Python
Instruções do exercício
- Crie uma lista
exchangescontendo exatamente as strings com os nomes das bolsas na ordem listada acima. - Use um laço for para iterar sobre
exchangescom uma variável iteradoraexchangeque contenha o nome de cada bolsa. Em cada iteração:- Aplique
.value_counts()a'Sector'e atribua o resultado asectors. - Ordene
sectorsem ordem decrescente e faça um gráfico de barras. - Mostre o resultado.
- Aplique
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create the list exchanges
exchanges = [____, ____, ____]
# Iterate over exchanges then plot and show result
for ____ in exchanges:
sectors = listings[____].____.____()
# Sort in descending order and plot
sectors.sort_values(____=____).plot(____=____)
# Show the plot
plt.show()