ComenzarEmpieza gratis

Carga una parte de una hoja de cálculo

Las hojas de cálculo pensadas para que las lean personas a menudo contienen varias tablas; por ejemplo, una pequeña empresa podría mantener un libro de inventario con tablas para distintos tipos de producto en una sola hoja. Incluso los datos tabulares pueden tener filas de encabezado con metadatos, como ocurre con los datos de la New Developer Survey aquí. Aunque los metadatos son útiles, no los queremos en un dataframe. Usarás el parámetro skiprows de read_excel() para obtener solo los datos. También crearás una cadena para pasar a usecols y quedarte solo con las columnas AD y de AW a BA, sobre objetivos laborales futuros.

pandas se ha importado como pd.

Este ejercicio forma parte del curso

Ingesta de datos eficiente con pandas

Ver curso

Instrucciones del ejercicio

  • Crea una única cadena, col_string, que indique que pandas debe cargar la columna AD y el rango de AW a BA.
  • Carga fcc_survey_headers.xlsx', estableciendo skiprows y usecols para omitir las dos primeras filas de metadatos y obtener solo las columnas en col_string.
  • Consulta los nombres de las columnas seleccionadas en el dataframe resultante.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create string of lettered columns to load
col_string = ____

# Load data with skiprows and usecols set
survey_responses = ____("fcc_survey_headers.xlsx", 
                        ____, 
                        ____)

# View the names of the columns selected
print(survey_responses.columns)
Editar y ejecutar código