Level faktor
Saat pertama kali menerima sebuah kumpulan data, Anda sering kali akan melihat bahwa ia berisi faktor dengan level tertentu. Namun, terkadang Anda ingin mengubah nama level tersebut demi kejelasan atau alasan lain. R memungkinkan Anda melakukan ini dengan fungsi levels():
levels(factor_vector) <- c("name1", "name2",...)
Contoh yang baik adalah data mentah yang diberikan kepada Anda oleh suatu survei. Pertanyaan umum dalam setiap kuesioner adalah jenis kelamin responden. Di sini, untuk sederhana, hanya dua kategori yang dicatat, "M" dan "F". (Biasanya Anda memerlukan lebih banyak kategori untuk data survei; bagaimanapun juga, Anda menggunakan faktor untuk menyimpan data kategorikal.)
survey_vector <- c("M", "F", "F", "M", "M")
Mencatat jenis kelamin dengan singkatan "M" dan "F" bisa memudahkan jika Anda mengumpulkan data dengan pena dan kertas, tetapi dapat menimbulkan kebingungan saat menganalisis data. Pada tahap itu, Anda sering ingin mengubah level faktor menjadi "Male" dan "Female" alih-alih "M" dan "F" agar lebih jelas.
Perhatian: urutan saat Anda menetapkan level penting. Jika Anda mengetik levels(factor_survey_vector), Anda akan melihat keluarannya adalah [1] "F" "M". Jika Anda tidak menentukan level faktor saat membuat vektor, R akan secara otomatis menetapkannya berdasarkan urutan alfabet. Untuk memetakan "F" ke "Female" dan "M" ke "Male" dengan benar, level harus diatur ke c("Female", "Male"), dalam urutan ini.
Latihan ini adalah bagian dari kursus
Pengantar R
Petunjuk latihan
- Periksa kode yang membangun vektor faktor dari
survey_vector. Anda harus menggunakanfactor_survey_vectorpada instruksi berikutnya. - Ubah level faktor pada
factor_survey_vectormenjadic("Female", "Male"). Perhatikan urutan elemen vektornya.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Code to build factor_survey_vector
survey_vector <- c("M", "F", "F", "M", "M")
factor_survey_vector <- factor(survey_vector)
# Specify the levels of factor_survey_vector
levels(factor_survey_vector) <-
factor_survey_vector