Menemukan variabel kategorikal
Variabel kategorikal adalah variabel yang menerima sejumlah nilai terbatas yang menggambarkan suatu kategori. Variabel ini dapat terdiri dari dua jenis:
- Ordinal – variabel dengan dua atau lebih kategori yang dapat diperingkat atau diurutkan (misalnya “rendah”, “sedang”, “tinggi”)
- Nominal – variabel dengan dua atau lebih kategori yang tidak memiliki urutan bawaan (misalnya “pria”, “wanita”)
Dalam latihan ini, Anda akan mencari variabel kategorikal dalam himpunan data. Untuk itu, pertama-tama impor pustaka pandas dan baca berkas CSV bernama "turnover.csv". Lalu, setelah meninjau 5 baris pertama dan melihat (secara visual) bahwa ada nilai nonnumerik di DataFrame, Anda akan memperoleh informasi tentang tipe variabel yang tersedia dalam himpunan data.
Latihan ini adalah bagian dari kursus
Analitik SDM: Memprediksi Perputaran Karyawan dengan Python
Petunjuk latihan
- Impor
pandas(sebagaipd) untuk membaca data. - Baca berkas
"turnover.csv"dan simpan dalam DataFrame bernamadata. - Lihat sekilas 5 baris pertama data.
- Dapatkan
info()-rmasi tentang tipe variabel dalam data.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import pandas (as pd) to read the data
import ____ as pd
# Read "turnover.csv" and save it in a DataFrame called data
data = pd.____("turnover.csv")
# Take a quick look to the first 5 rows of data
print(data.____())
# Get some information on the types of variables in data
data.____()