1. Apprendre
  2. /
  3. Cours
  4. /
  5. Introduction à l'importation de données en Python

Connected

Exercice

Utiliser pandas pour importer des fichiers plats comme DataFrames (2)

Dans le dernier exercice, vous avez pu importer des fichiers plats dans un DataFrame pandas. En prime, il est ensuite facile de récupérer le tableau numpy correspondant au moyen de la méthode .to_numpy(). Vous aurez maintenant l'occasion de le faire avec l'ensemble de données MNIST, disponible sous le nom digits.csv.

Plusieurs arguments de pd.read_csv() vous seront utiles pour cet exercice :

  • nrows vous permet d'indiquer combien de lignes lire dans le fichier. Par exemple, nrows=10 n'importera que les 10 premières lignes.
  • header accepte les numéros de ligne à utiliser comme étiquettes de colonnes et marque le début des données. Si le fichier ne contient pas de ligne d'en-tête, vous pouvez définir header=None, et pandas attribuera automatiquement des étiquettes de colonnes entières à partir de 0 (p. ex., 0, 1, 2, …).

Instructions

100 XP
  • Importez les 5 premières lignes du fichier dans un DataFrame à l'aide de la fonction pd.read_csv() et assignez le résultat à data. Vous devrez utiliser les arguments nrows et header. Notez qu'il n'y a pas de ligne d'en-tête dans ce fichier.
  • Construisez un tableau numpy à partir du DataFrame obtenu dans data et assignez-le à data_array.
  • Exécutez print(type(data_array)) pour afficher le type de données de data_array.