Usare NumPy per importare flat file
In questo esercizio caricherai il dataset MNIST per il riconoscimento delle cifre usando la funzione loadtxt() di NumPy e vedrai quanto può essere semplice:
- Il primo argomento sarà il nome del file.
- Il secondo sarà il delimitatore che, in questo caso, è una virgola.
Il dataset MNIST è una raccolta di cifre scritte a mano da 0 a 9, usata spesso nell’ambito del Machine Learning. Viene impiegato come benchmark per valutare le prestazioni degli algoritmi nel riconoscimento e nella classificazione di questi numeri.
Questo esercizio fa parte del corso
Introduzione all'importazione dei dati in Python
Istruzioni dell'esercizio
- Compila gli argomenti di
np.loadtxt()passandofilee una virgola','come delimitatore. - Compila l’argomento di
print()per stampare il tipo dell’oggettodigits. Usa la funzionetype(). - Esegui il resto del codice per visualizzare una delle righe dei dati.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import packages
import numpy as np
# Assign filename to variable: file
file = 'digits.csv'
# Load file as array: digits
digits = np.loadtxt(____, delimiter='____')
# Print datatype of digits
print(____)
# Select and reshape a row
im = digits[21, 1:]
im_sq = np.reshape(im, (28, 28))
# Plot reshaped data (matplotlib.pyplot already loaded as plt)
plt.imshow(im_sq, cmap='Greys', interpolation='nearest')
plt.show()