ComeçarComece de graça

Todas as estatísticas descritivas por setor

Você pode aplicar várias estatísticas descritivas que aprendeu no último capítulo a um objeto groupby para obter resultados por categoria. Isso inclui a função .describe(), que fornece vários insights de uma só vez!

Aqui, você vai praticar isso com as listagens da NASDAQ. pandas já foi importado como pd, e os dados das empresas listadas na bolsa NASDAQ estão disponíveis no seu workspace no DataFrame nasdaq.

Este exercício faz parte do curso

Importing and Managing Financial Data in Python

Ver curso

Instruções do exercício

  • Inspecione os dados nasdaq usando .info().
  • Crie uma nova coluna market_cap_m que contenha o market cap em milhões de USD. Na linha seguinte, remova a coluna 'Market Capitalization'.
  • Agrupe seus dados nasdaq por 'Sector' e atribua a nasdaq_by_sector.
  • Chame o método .describe() em nasdaq_by_sector, atribua a summary e imprima o resultado.
  • Isso funciona, mas result está em formato longo e usa um pd.MultiIndex() que você viu antes. Converta summary para o formato largo chamando .unstack().

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Inspect NASDAQ data
nasdaq.____()

# Create market_cap_m
nasdaq['market_cap_m'] = ____[____].div(1e6)

# Drop the Market Capitalization column
nasdaq.drop('Market Capitalization', axis=1, inplace=True)

# Group nasdaq by Sector
nasdaq_by_sector = ____.____(____)

# Create summary statistics by sector
summary = ____.____()

# Print the summary
print(summary)

# Unstack 
summary = ____.____()

# Print the summary again
print(summary)
Editar e executar o código