O argumento de ignorar
Outro argumento que pode ser muito útil quando você lê arquivos do Excel que são menos organizados é skip
. Com skip
, você pode dizer ao R para ignorar um número específico de linhas dentro das planilhas do Excel das quais você está tentando extrair dados. Dê uma olhada neste exemplo:
read_excel("data.xlsx", skip = 15)
Nesse caso, as primeiras 15 linhas da primeira planilha do site "data.xlsx"
são ignoradas.
Se a primeira linha dessa planilha contiver os nomes das colunas, essas informações também serão ignoradas pelo site readxl
. Não se esqueça de definir col_names
como FALSE
ou especificar manualmente os nomes das colunas nesse caso!
O arquivo urbanpop.xlsx
(view) está disponível no seu diretório; ele tem nomes de colunas nas primeiras linhas.
Este exercício faz parte do curso
Introdução à importação de dados no R
Instruções de exercício
- Importe a segunda folha de
"urbanpop.xlsx"
, mas ignore as primeiras 21 linhas. Certifique-se de definircol_names = FALSE
. Armazene o quadro de dados resultante em uma variávelurbanpop_sel
. - Selecione a primeira observação em
urbanpop_sel
e imprima-a.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Import the second sheet of urbanpop.xlsx, skipping the first 21 rows: urbanpop_sel
urbanpop_sel <- read_excel("urbanpop.xlsx", sheet = ___, col_names =___, skip = ___)
# Print out the first observation from urbanpop_sel
___