1. Apprendre
  2. /
  3. Cours
  4. /
  5. Вступ до імпорту даних у Python

Connected

Exercice

Імпорт плоских файлів у DataFrame за допомогою pandas (2)

У попередній вправі ви імпортували плоскі файли у DataFrame бібліотеки pandas. Як бонус, після цього легко отримати відповідний масив numpy за допомогою методу .to_numpy(). Тепер ви зможете зробити це на наборі даних MNIST, що доступний як digits.csv.

Функція pd.read_csv() має низку аргументів, корисних для цієї вправи:

  • nrows дає змогу вказати, скільки рядків читати з файлу. Наприклад, nrows=10 імпортує лише перші 10 рядків.
  • header приймає номери рядків, які слід використати як підписи стовпців і які позначають початок даних. Якщо файл не містить рядка заголовків, ви можете встановити header=None, і pandas автоматично призначить цілочислові підписи стовпців, починаючи з 0 (наприклад, 0, 1, 2, …).

Instructions

100 XP
  • Імпортуйте перші 5 рядків файлу у DataFrame за допомогою функції pd.read_csv() і присвойте результат змінній data. Використайте аргументи nrows і header. Зверніть увагу, що у файлі немає рядка заголовків.
  • Створіть масив numpy з отриманого DataFrame у data і присвойте його до data_array.
  • Виконайте print(type(data_array)), щоб вивести тип даних змінної data_array.