1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶ中級データインポート

Connected

演習

Factorize, round two

前の演習では、read_sav() コマンドを使ってデータファイルを読み込む方法を学びました。SPSS のデータファイルでは、インポートした変数の一部が labelled クラスになることがあります。これは、元の .sav や .por ファイルに含まれていたラベル情報を保持するためです。これらの変数は、R の標準的なクラスである factor などに変換(強制)することが推奨されます。

この演習のデータには、従業員とその人口統計・経済属性に関する情報が含まれています(出典: QRiE)。データは次の URL で確認できます。

https://assets.datacamp.com/production/course_1478/datasets/employee.sav

指示

100 XP
  • URL から SPSS データを直接インポートし、得られたデータフレームを work として保存します。
  • work の GENDER 列のサマリーを表示します。あまり有用な情報が得られませんよね?
  • work の GENDER 列を、R でカテゴリ変数を表すクラスである factor に変換します。as_factor() を使ってください。
  • もう一度 GENDER 列のサマリーを表示します。今度はずっと意味のある出力になっているはずです。