1. เรียนรู้
  2. /
  3. Courses
  4. /
  5. Python에서 데이터 가져오기 입문

Connected

Exercises

pandas로 평면 파일을 DataFrame으로 가져오기 (2)

이전 연습 문제에서는 평면 파일을 pandas DataFrame으로 가져오는 방법을 살펴봤어요. 보너스로, .to_numpy() 메서드를 사용하면 해당 numpy 배열을 손쉽게 얻을 수 있죠. 이제 digits.csv로 제공되는 MNIST 데이터셋을 사용해 이를 직접 해보겠습니다.

이 연습 문제에서 유용하게 쓸 수 있는 pd.read_csv()의 인자들은 다음과 같아요:

  • nrows는 파일에서 읽을 행의 개수를 지정합니다. 예를 들어, nrows=10은 처음 10개 행만 가져옵니다.
  • header는 열 이름으로 사용할 행 번호를 받아들이며, 데이터의 시작 지점을 표시합니다. 파일에 헤더 행이 없다면 header=None으로 설정하세요. 그러면 pandas가 0부터 시작하는 정수 열 이름(예: 0, 1, 2, …)을 자동으로 지정합니다.

คำแนะนำ

100 XP
  • 함수 pd.read_csv()를 사용해 파일의 처음 5개 행을 DataFrame으로 가져오고, 결과를 data에 할당하세요. 이때 nrows와 header 인자를 사용해야 합니다. 이 파일에는 헤더 행이 없다는 점에 유의하세요.
  • 생성된 DataFrame data로부터 numpy 배열을 만들어 data_array에 할당하세요.
  • print(type(data_array))를 실행해 data_array의 데이터 타입을 출력하세요.