1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập dữ liệu nâng cao trong R

Connected

Bài tập

Nhập dữ liệu STATA với haven

Tiếp theo là các tệp dữ liệu STATA; bạn có thể dùng read_dta() cho các tệp này.

Khi kiểm tra kết quả của lời gọi read_dta(), bạn sẽ thấy một cột được nhập dưới dạng vector labelled, là một tương đương trong R cho cấu trúc dữ liệu phổ biến ở các phần mềm thống kê khác. Để tiếp tục làm việc hiệu quả với dữ liệu trong R, tốt nhất là chuyển dữ liệu này về một lớp chuẩn của R. Để chuyển một biến có lớp labelled sang factor, bạn cần hàm as_factor() của haven.

Trong bài tập này, bạn sẽ làm việc với dữ liệu về số lượng nhập khẩu và xuất khẩu đường theo năm, cả theo USD và theo trọng lượng. Dữ liệu có tại: https://assets.datacamp.com/production/course_1478/datasets/trade.dta

Hướng dẫn

100 XP
  • Nhập trực tiếp tệp dữ liệu từ URL bằng read_dta(), và lưu thành sugar.
  • In cấu trúc của sugar. Cột Date có lớp labelled.
  • Chuyển các giá trị trong cột Date của sugar thành kiểu ngày, dùng as.Date(as_factor(___)).
  • In lại cấu trúc của sugar. Trông ổn hơn chưa?