Personalizando a importação do NumPy
E se houver linhas, como um cabeçalho, que você não deseja importar? E se o seu arquivo tiver um delimitador que não seja uma vírgula? E se você quiser importar apenas colunas específicas?
Há uma série de argumentos que o site np.loadtxt()
adota
que você achará útil:
delimiter
altera o delimitador que o siteloadtxt()
está esperando.Você pode usar
','
para delimitação por vírgula.Você pode usar
'\t'
para delimitação por tabulação.
skiprows
permite especificar quantas linhas (não índices) você deseja ignorar.usecols
recebe uma lista dos índices das colunas que você deseja manter.
O arquivo que você importará, digits_header.txt
, tem um cabeçalho e é delimitado por tabulação.
Este exercício faz parte do curso
Introdução à importação de dados em Python
Instruções de exercício
- Complete os argumentos de
np.loadtxt()
: o arquivo que você está importando é delimitado por tabulação, você deseja ignorar a primeira linha e importar apenas a primeira e a terceira colunas. - Complete o argumento da chamada
print()
para imprimir a matriz inteira que você acabou de importar.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Import numpy
import numpy as np
# Assign the filename: file
file = 'digits_header.txt'
# Load the data: data
data = np.loadtxt(____, delimiter='____', skiprows=____, usecols=[____])
# Print data
print(____)