Latihan mengabaikan sensor
Anda mengadakan pesta dan pada pukul 1 dini hari para tamu tiba-tiba mulai menari. Anda ingin menganalisis berapa lama mereka akan menari dan mulai mengumpulkan data. Masalahnya, Anda lelah dan pergi tidur setelah beberapa saat.
Anda memperoleh data waktu menari yang tersensor kanan berikut pada dancedat:
nameadalah nama teman Anda.timeadalah waktu menari yang tersensor kanan.obs_endmenunjukkan apakah Anda mengamati akhir tarian teman Anda (1) atau Anda tertidur sebelum mereka berhenti menari (0).
Anda mulai menganalisis data di pagi hari, tetapi Anda lelah dan pada awalnya mengabaikan fakta bahwa ada pengamatan tersensor. Lalu Anda teringat kursus ini di DataCamp dan melakukannya dengan benar.
Paket survival sudah dimuat untuk Anda dalam latihan ini.
Latihan ini adalah bagian dari kursus
Analisis Survival di R
Petunjuk latihan
- Estimasikan fungsi survival dengan berpura-pura bahwa semua pengamatan tersensor adalah pengamatan sebenarnya.
- Estimasikan fungsi survival dari himpunan data ini menggunakan Kaplan–Meier.
- Plot kurva survival yang benar dan yang salah keduanya menggunakan
ggsurvplot_combine()lalu bandingkan. Perhatikan perbedaannya.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create dancedat data
dancedat <- data.frame(
name = c("Chris", "Martin", "Conny", "Desi", "Reni", "Phil",
"Flo", "Andrea", "Isaac", "Dayra", "Caspar"),
time = c(20, 2, 14, 22, 3, 7, 4, 15, 25, 17, 12),
obs_end = c(1, 1, 0, 1, 1, 1, 1, 1, 0, 0, 0))
# Estimate the survivor function pretending that all censored observations are actual observations.
km_wrong <- survfit(___(time) ~ 1, data = dancedat)
# Estimate the survivor function from this dataset via kaplan-meier.
km <- survfit(___(___, ___) ~ ___, data = dancedat)
# Plot the two and compare
ggsurvplot_combine(list(correct = ___, wrong = ___))