1. Learn
  2. /
  3. Cursuri
  4. /
  5. Introducere în importul datelor în Python

Connected

exercițiu

Importul fișierelor plate ca DataFrame-uri cu pandas (2)

În exercițiul anterior, ai reușit să imporți fișiere plate într-un DataFrame pandas. Ca bonus, este foarte simplu să obții array-ul numpy corespunzător folosind metoda .to_numpy(). Acum vei avea ocazia să faci asta cu setul de date MNIST, disponibil ca digits.csv.

Există câțiva argumenți ai funcției pd.read_csv() care îți vor fi utili în acest exercițiu:

  • nrows îți permite să specifici câte rânduri să citești din fișier. De exemplu, nrows=10 va importa doar primele 10 rânduri.
  • header acceptă numere de rând care să fie folosite ca etichete de coloane și marchează începutul datelor. Dacă fișierul nu conține un rând de antet, poți seta header=None, iar pandas va atribui automat etichete întregi coloanelor, începând de la 0 (de exemplu, 0, 1, 2, …).

Instrucțiuni

100 XP
  • Importă primele 5 rânduri din fișier într-un DataFrame folosind funcția pd.read_csv() și atribuie rezultatul variabilei data. Va trebui să folosești argumentele nrows și header. Reține că acest fișier nu conține un rând de antet.
  • Construiește un array numpy din DataFrame-ul rezultat în data și atribuie-l variabilei data_array.
  • Execută print(type(data_array)) pentru a afișa tipul de date al variabilei data_array.