Todas as estatísticas descritivas por setor
Você pode aplicar várias estatísticas descritivas que aprendeu no último capítulo a um objeto groupby para obter resultados por categoria. Isso inclui a função .describe(), que fornece vários insights de uma só vez!
Aqui, você vai praticar isso com as listagens da NASDAQ. pandas já foi importado como pd, e os dados das empresas listadas na bolsa NASDAQ estão disponíveis no seu workspace no DataFrame nasdaq.
Este exercício faz parte do curso
Importing and Managing Financial Data in Python
Instruções do exercício
- Inspecione os dados
nasdaqusando.info(). - Crie uma nova coluna
market_cap_mque contenha o market cap em milhões de USD. Na linha seguinte, remova a coluna'Market Capitalization'. - Agrupe seus dados
nasdaqpor'Sector'e atribua anasdaq_by_sector. - Chame o método
.describe()emnasdaq_by_sector, atribua asummarye imprima o resultado. - Isso funciona, mas
resultestá em formato longo e usa umpd.MultiIndex()que você viu antes. Convertasummarypara o formato largo chamando.unstack().
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Inspect NASDAQ data
nasdaq.____()
# Create market_cap_m
nasdaq['market_cap_m'] = ____[____].div(1e6)
# Drop the Market Capitalization column
nasdaq.drop('Market Capitalization', axis=1, inplace=True)
# Group nasdaq by Sector
nasdaq_by_sector = ____.____(____)
# Create summary statistics by sector
summary = ____.____()
# Print the summary
print(summary)
# Unstack
summary = ____.____()
# Print the summary again
print(summary)