1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập dữ liệu nâng cao trong R

Connected

Bài tập

Nhập dữ liệu SAS với haven

haven là một package cực kỳ dễ dùng để nhập dữ liệu từ ba phần mềm thống kê: SAS, STATA và SPSS. Tùy phần mềm mà bạn dùng các hàm khác nhau:

  • SAS: read_sas()
  • STATA: read_dta() (hoặc read_stata(), hai hàm này tương đương)
  • SPSS: read_sav() hoặc read_por(), tùy loại tệp.

Tất cả các hàm này nhận một đối số chính: đường dẫn đến tệp cục bộ của bạn. Thực tế, bạn còn có thể truyền một URL; haven sẽ tự động tải tệp về trước khi nhập.

Bạn sẽ làm việc với dữ liệu về tuổi, giới tính, thu nhập và mức độ mua hàng (0 = thấp, 1 = cao) của 36 cá nhân (Nguồn: SAS). Thông tin được lưu trong tệp SAS, sales.sas7bdat, có sẵn trong thư mục làm việc hiện tại. Bạn cũng có thể tải dữ liệu tại đây.

Hướng dẫn

100 XP
  • Nạp package haven; package này đã được cài sẵn trên máy chủ của DataCamp.
  • Nhập tệp dữ liệu "sales.sas7bdat". Đặt tên data frame đã nhập là sales.
  • Hiển thị cấu trúc của sales với str(). Một số cột là biến phân loại nên chúng nên là factor.