1. Lära sig
  2. /
  3. Courses
  4. /
  5. Python에서 Spark SQL 입문

Connected

exercise

parquet 파일에서 데이터프레임 로드하기

작업 공간에는 sherlock_sentences.parquet라는 데이터프레임 파일이 있습니다. 이 데이터프레임의 각 행에는 하나의 절(clause)이 들어 있습니다. 각 절은 마침표, 따옴표 등 문장이나 문장 조각을 나타내는 구두점과 같은 자연어 구분 기호로 다른 절과 분리된 단어의 연속입니다. 이제 이 파일을 로드해 주세요.

Instruktioner

100 XP
  • sherlock_sentences.parquet를 로드하세요.
  • "id > 70"로 필터링하고, 처음 5개 행을 표시하세요.