Aan de slagGa gratis aan de slag

Platte bestanden importeren met NumPy

In deze oefening ga je de MNIST-dataset voor cijferherkenning laden met de numpy-functie loadtxt() om te zien hoe eenvoudig dat kan:

  • Het eerste argument is de bestandsnaam.
  • Het tweede is het scheidingsteken, in dit geval een komma.

De MNIST-gegevensset is een verzameling handgeschreven cijfers van 0 tot en met 9, veelgebruikt binnen machine learning. Hij fungeert als benchmark om te beoordelen hoe goed algoritmen deze cijfers kunnen herkennen en classificeren.

Deze oefening maakt deel uit van de cursus

Introductie tot data importeren in Python

Cursus bekijken

Oefeninstructies

  • Vul de argumenten van np.loadtxt() in door file en een komma ',' als scheidingsteken door te geven.
  • Vul het argument van print() in om het type van het object digits af te drukken. Gebruik de functie type().
  • Voer de rest van de code uit om een van de rijen van de data te visualiseren.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Import packages
import numpy as np

# Assign filename to variable: file
file = 'digits.csv'

# Load file as array: digits
digits = np.loadtxt(____, delimiter='____')

# Print datatype of digits
print(____)

# Select and reshape a row
im = digits[21, 1:]
im_sq = np.reshape(im, (28, 28))

# Plot reshaped data (matplotlib.pyplot already loaded as plt)
plt.imshow(im_sq, cmap='Greys', interpolation='nearest')
plt.show()
Code bewerken en uitvoeren