ComeçarComece de graça

Calcular várias métricas por setor e bolsa

A função .agg() permite agregar seus dados de várias formas. Fornecer uma lista com nomes de métodos estatísticos calcula mais de uma estatística de resumo de uma vez. Você pode fornecer novos nomes para as colunas agregadas usando o método rename, que recebe um dicionário em que as chaves são os nomes das métricas que você calculou e os valores são os novos nomes desejados.

Neste exercício, você vai calcular a média, a mediana e o desvio padrão das capitalizações de mercado em milhões de USD. pandas como pd e matplotlib.pyplot como plt já foram importados, e o DataFrame listings, com a coluna de referência 'Exchange', está disponível no seu workspace.

Este exercício faz parte do curso

Importing and Managing Financial Data in Python

Ver curso

Instruções do exercício

  • Com broadcasting e .div(), crie uma nova coluna 'market_cap_m' que contenha os dados de capitalização de mercado em milhões de USD.
  • Agrupe seus dados por 'Sector' e 'Exchange', atribuindo o resultado a by_sector_exchange.
  • Atribua a coluna market_cap_m de by_sector_exchange a uma variável bse_mcm.
  • Use .agg() para calcular a média, a mediana e o desvio padrão de market_cap_m, e chame o método rename com um dicionário para o parâmetro nomeado columns, armazenando os resultados em 'Average', 'Median' e 'Standard Deviation', respectivamente, e atribua a summary.
  • Imprima o resultado no seu console.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create market_cap_m
listings['market_cap_m'] = ____[____].div(1e6)

# Group listing by both Sector and Exchange
by_sector_exchange = ____.____(['Sector', 'Exchange'])

# Subset market_cap_m of by_sector_exchange
bse_mcm = ____[____]

# Calculate mean, median, and std in summary
summary = ____.____(['____', '____', '____']).rename(columns={'mean': ____, 'median': ____, 'std':____})

# Print the summary
print(summary)
Editar e executar o código