MulaiMulai sekarang secara gratis

Regresi linear dengan data tidak lengkap

Data hilang adalah masalah umum dan menanganinya dengan tepat sangatlah penting. Mengabaikan titik data yang hilang atau mengisinya secara keliru dapat membuat model berperilaku tidak terduga serta menyebabkan prediksi dan inferensi menjadi bias.

Dalam bab ini, Anda akan bekerja dengan himpunan data biopics. Himpunan data ini memuat informasi tentang sejumlah film biografi, termasuk pendapatan, karakteristik subjek, dan beberapa variabel lainnya. Namun, sebagian titik data hilang. Data asli tersedia dalam paket R fivethirtyeight, tetapi dalam kursus ini, Anda akan menggunakan versi yang telah dipraproses sedikit.

Pada latihan ini, Anda akan mengenali himpunan data tersebut dan memasangkan model regresi linear untuk menjelaskan pendapatan sebuah film. Mari kita mulai!

Latihan ini adalah bagian dari kursus

Menangani Data Hilang dengan Imputasi di R

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Print first 10 observations
___(biopics, ___)
Edit dan Jalankan Kode