Todas las estadísticas descriptivas por sector
Puedes aplicar las distintas estadísticas descriptivas que viste en el capítulo anterior a un objeto groupby para obtener el resultado por categoría. Esto incluye la función .describe(), que ofrece varias métricas a la vez.
Aquí podrás practicarlo con los listados del NASDAQ. pandas ya se ha importado como pd, y los datos de los listados de la bolsa NASDAQ están disponibles en tu entorno en el DataFrame nasdaq.
Este ejercicio forma parte del curso
Importación y gestión de datos financieros en Python
Instrucciones del ejercicio
- Inspecciona los datos de
nasdaqusando.info(). - Crea una nueva columna
market_cap_mque contenga la capitalización bursátil en millones de USD. En la siguiente línea, elimina la columna'Market Capitalization'. - Agrupa tus datos de
nasdaqpor'Sector'y asígnalo anasdaq_by_sector. - Llama al método
.describe()sobrenasdaq_by_sector, asígnalo asummarye imprime el resultado. - Esto funciona, pero
resultestá en formato largo y usa unpd.MultiIndex()que ya viste. Conviertesummarya formato ancho llamando a.unstack().
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Inspect NASDAQ data
nasdaq.____()
# Create market_cap_m
nasdaq['market_cap_m'] = ____[____].div(1e6)
# Drop the Market Capitalization column
nasdaq.drop('Market Capitalization', axis=1, inplace=True)
# Group nasdaq by Sector
nasdaq_by_sector = ____.____(____)
# Create summary statistics by sector
summary = ____.____()
# Print the summary
print(summary)
# Unstack
summary = ____.____()
# Print the summary again
print(summary)