Calcular várias métricas por setor e bolsa
A função .agg() permite agregar seus dados de várias formas. Fornecer uma lista com nomes de métodos estatísticos calcula mais de uma estatística de resumo de uma vez. Você pode fornecer novos nomes para as colunas agregadas usando o método rename, que recebe um dicionário em que as chaves são os nomes das métricas que você calculou e os valores são os novos nomes desejados.
Neste exercício, você vai calcular a média, a mediana e o desvio padrão das capitalizações de mercado em milhões de USD. pandas como pd e matplotlib.pyplot como plt já foram importados, e o DataFrame listings, com a coluna de referência 'Exchange', está disponível no seu workspace.
Este exercício faz parte do curso
Importing and Managing Financial Data in Python
Instruções do exercício
- Com broadcasting e
.div(), crie uma nova coluna'market_cap_m'que contenha os dados de capitalização de mercado em milhões de USD. - Agrupe seus dados por
'Sector'e'Exchange', atribuindo o resultado aby_sector_exchange. - Atribua a coluna
market_cap_mdeby_sector_exchangea uma variávelbse_mcm. - Use
.agg()para calcular a média, a mediana e o desvio padrão demarket_cap_m, e chame o método rename com um dicionário para o parâmetro nomeadocolumns, armazenando os resultados em'Average','Median'e'Standard Deviation', respectivamente, e atribua asummary. - Imprima o resultado no seu console.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create market_cap_m
listings['market_cap_m'] = ____[____].div(1e6)
# Group listing by both Sector and Exchange
by_sector_exchange = ____.____(['Sector', 'Exchange'])
# Subset market_cap_m of by_sector_exchange
bse_mcm = ____[____]
# Calculate mean, median, and std in summary
summary = ____.____(['____', '____', '____']).rename(columns={'mean': ____, 'median': ____, 'std':____})
# Print the summary
print(summary)