O argumento skip
Outro argumento que pode ser muito útil ao ler arquivos do Excel que são menos organizados é skip. Com skip, você pode dizer ao R para ignorar um número específico de linhas das planilhas do Excel das quais você está tentando extrair dados. Dê uma olhada neste exemplo:
read_excel("data.xlsx", skip = 15)
Nesse caso, as primeiras 15 linhas da primeira planilha de "data.xlsx" são ignoradas.
Se a primeira linha dessa planilha contiver os nomes das colunas, essas informações também serão ignoradas por readxl. Não se esqueça de definir col_names como FALSE ou especificar manualmente os nomes das colunas nesse caso!
O arquivo urbanpop.xlsx (visualizar) está disponível no seu diretório; ele tem nomes de colunas nas primeiras linhas.
Este exercício faz parte do curso
Introdução à Importação de Dados no R
Instruções do exercício
- Importe a segunda planilha de
"urbanpop.xlsx", mas ignore as primeiras 21 linhas. Lembre-se de definircol_names = FALSE. Armazene o quadro de dados resultante em uma variável chamadaurbanpop_sel. - Selecione a primeira observação de
urbanpop_sele imprima-a.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import the second sheet of urbanpop.xlsx, skipping the first 21 rows: urbanpop_sel
urbanpop_sel <- read_excel("urbanpop.xlsx", sheet = ___, col_names =___, skip = ___)
# Print out the first observation from urbanpop_sel
___