1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 Market Basket Analysis

Connected

연습 문제

마켓 바스켓 분석을 위한 데이터 준비

이 강의 전반에서 데이터는 보통 두 가지 형식 중 하나로 제공됩니다. 바로 pandas DataFrame 또는 리스트의 리스트 형식입니다. DataFrame 객체는 pandas로 csv 파일을 임포트해 생성하며, 아래 표처럼 각 요소가 쉼표로 구분된 거래 품목 문자열을 담는 단일 열로 구성됩니다.

이번 연습 문제에서는 csv 파일에서 데이터를 불러오고, 리스트의 리스트로 사용할 수 있도록 준비해 보겠습니다. 식료품점 데이터세트의 경로는 groceries_path로 미리 정의되어 제공됩니다.

Transaction
'milk,bread,biscuit'
'bread,milk,biscuit,cereal'
…
'tea,milk,coffee,cereal'

지침

100 XP
  • pandas 패키지를 별칭 pd로 임포트하세요.
  • groceries_path에 지정된 경로의 csv 파일을 pandas로 읽어들이세요.
  • DataFrame에서 Transaction 열을 선택한 뒤, 각 쉼표로 구분된 품목 문자열을 리스트로 분할하세요.
  • 거래 DataFrame을 리스트의 리스트로 변환하세요.