Platte bestanden importeren met NumPy
In deze oefening ga je de MNIST-dataset voor cijferherkenning laden met de numpy-functie loadtxt() om te zien hoe eenvoudig dat kan:
- Het eerste argument is de bestandsnaam.
- Het tweede is het scheidingsteken, in dit geval een komma.
De MNIST-gegevensset is een verzameling handgeschreven cijfers van 0 tot en met 9, veelgebruikt binnen machine learning. Hij fungeert als benchmark om te beoordelen hoe goed algoritmen deze cijfers kunnen herkennen en classificeren.
Deze oefening maakt deel uit van de cursus
Introductie tot data importeren in Python
Oefeninstructies
- Vul de argumenten van
np.loadtxt()in doorfileen een komma','als scheidingsteken door te geven. - Vul het argument van
print()in om het type van het objectdigitsaf te drukken. Gebruik de functietype(). - Voer de rest van de code uit om een van de rijen van de data te visualiseren.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import packages
import numpy as np
# Assign filename to variable: file
file = 'digits.csv'
# Load file as array: digits
digits = np.loadtxt(____, delimiter='____')
# Print datatype of digits
print(____)
# Select and reshape a row
im = digits[21, 1:]
im_sq = np.reshape(im, (28, 28))
# Plot reshaped data (matplotlib.pyplot already loaded as plt)
plt.imshow(im_sq, cmap='Greys', interpolation='nearest')
plt.show()