Carregar uma parte de uma planilha

Planilhas feitas para leitura por pessoas costumam ter várias tabelas; por exemplo, uma pequena empresa pode manter uma pasta de trabalho de inventário com tabelas para diferentes tipos de produtos em uma única aba. Mesmo dados tabulares podem ter linhas de cabeçalho com metadados, como no conjunto New Developer Survey aqui. Embora os metadados sejam úteis, não queremos isso em um dataframe. Você vai usar o parâmetro skiprows de read_excel() para carregar apenas os dados. Você também vai criar uma string para passar para usecols a fim de obter somente a coluna AD e o intervalo de AW até BA, sobre objetivos de emprego futuros.

pandas já foi importado como pd.

Este exercicio faz parte do curso

Ingestão de dados simplificada com pandas

Ver curso

Instruções do exercicio

Crie uma única string, col_string, especificando que o pandas deve carregar a coluna AD e também o intervalo de AW até BA.
Carregue fcc_survey_headers.xlsx', definindo skiprows e usecols para ignorar as duas primeiras linhas de metadados e obter apenas as colunas em col_string.
Veja os nomes das colunas selecionadas no dataframe resultante.

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Create string of lettered columns to load
col_string = ____

# Load data with skiprows and usecols set
survey_responses = ____("fcc_survey_headers.xlsx", 
                        ____, 
                        ____)

# View the names of the columns selected
print(survey_responses.columns)

Editar e Executar Código