Regresi linear dengan data tidak lengkap
Data hilang adalah masalah umum dan menanganinya dengan tepat sangatlah penting. Mengabaikan titik data yang hilang atau mengisinya secara keliru dapat membuat model berperilaku tidak terduga serta menyebabkan prediksi dan inferensi menjadi bias.
Dalam bab ini, Anda akan bekerja dengan himpunan data biopics. Himpunan data ini memuat informasi tentang sejumlah film biografi, termasuk pendapatan, karakteristik subjek, dan beberapa variabel lainnya. Namun, sebagian titik data hilang. Data asli tersedia dalam paket R fivethirtyeight, tetapi dalam kursus ini, Anda akan menggunakan versi yang telah dipraproses sedikit.
Pada latihan ini, Anda akan mengenali himpunan data tersebut dan memasangkan model regresi linear untuk menjelaskan pendapatan sebuah film. Mari kita mulai!
Latihan ini adalah bagian dari kursus
Menangani Data Hilang dengan Imputasi di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Print first 10 observations
___(biopics, ___)