Penggunaan nomina dalam berita palsu

Dalam latihan ini, Anda diberikan sebuah dataframe headlines yang berisi judul berita yang termasuk palsu atau asli. Tugas Anda adalah membuat dua fitur baru num_propn dan num_noun yang merepresentasikan jumlah nomina diri (proper noun) dan nomina lainnya yang terdapat pada fitur title dari headlines.

Selanjutnya, kita akan menghitung rata-rata jumlah nomina diri dan nomina lainnya yang digunakan dalam judul berita palsu dan asli, lalu membandingkan nilainya. Jika terdapat perbedaan yang mencolok, besar kemungkinan penggunaan fitur num_propn dan num_noun dalam detektor berita palsu akan meningkatkan kinerjanya.

Untuk menyelesaikan tugas ini, fungsi proper_nouns dan nouns yang telah Anda buat pada latihan sebelumnya sudah tersedia untuk Anda gunakan.

Latihan ini merupakan bagian dari kursus

Rekayasa Fitur untuk NLP di Python

Lihat Kursus

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

headlines[____] = headlines['title'].apply(____)

# Compute mean of proper nouns
real_propn = headlines[headlines['label'] == 'REAL']['num_propn'].mean()
fake_propn = headlines[headlines['label'] == 'FAKE']['num_propn'].____

# Print results
print("Mean no. of proper nouns in real and fake headlines are %.2f and %.2f respectively"%(real_propn, fake_propn))

Edit dan Jalankan Kode