1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. pandas로 빠르고 간편한 데이터 적재

Connected

Bài tập

SQL로 컬럼 선택하기

데이터셋에는 분석에 꼭 필요하지 않은 컬럼이 포함될 수 있어요. data.db의 weather 테이블이 그런 예예요. 예를 들어, 모든 관측이 같은 장소에서 이루어졌다면 고도(elevation)처럼 중복되는 정보가 있을 수 있고, 또는 우리가 관심 없는 변수가 있을 수도 있죠. 데이터베이스 엔진을 만든 다음, 날짜와 기온 컬럼만 SELECT하는 쿼리를 작성하고, 이를 read_sql()에 전달해 최고/최저 기온을 담은 데이터프레임을 만들어 볼게요.

pandas는 pd로 불러와 두었고, create_engine()는 sqlalchemy에서 임포트되어 있어요.

참고: 이 SQL 채커는 컬럼 위치에 매우 엄격해서, 지정된 순서대로 필드를 선택해야 해요.

Hướng dẫn

100 XP
  • data.db에 대한 데이터베이스 엔진을 생성하세요.
  • weather 테이블에서 date, tmax, tmin 컬럼을 SELECT하는 SQL 쿼리를 작성하세요.
  • 쿼리와 엔진을 read_sql()에 전달해 데이터프레임을 만들고, 결과를 temperatures에 할당하세요.