MulaiMulai sekarang secara gratis

Menggabungkan heuristik

Seorang analis siber lain memberi tahu Anda bahwa selama jenis serangan tertentu, komputer sumber yang terinfeksi mengirimkan lalu lintas dalam ukuran kecil untuk menghindari deteksi. Hal ini membuat Anda bertanya-tanya apakah lebih baik membuat heuristik gabungan yang sekaligus mencari jumlah port yang besar dan ukuran paket yang kecil. Apakah ini meningkatkan kinerja dibandingkan heuristik port sederhana? Seperti pada latihan sebelumnya, Anda memiliki X_train, X_test, y_train, dan y_test di memori. Kode contoh juga membantu Anda mereproduksi hasil heuristik port, pred_port. Anda juga telah memuat numpy sebagai np dan accuracy_score().

Latihan ini adalah bagian dari kursus

Merancang Alur Kerja Machine Learning di Python

Lihat Kursus

Petunjuk latihan

  • Kolom average_packet menghitung ukuran paket rata-rata dari semua aliran yang diamati dari satu sumber. Ambil mean dari nilai tersebut untuk sumber buruk saja pada himpunan pelatihan.
  • Sekarang bangun aturan baru yang menandai positif semua sumber yang rata-rata lalu lintasnya kurang dari nilai di atas.
  • Gabungkan aturan sehingga kedua heuristik harus berlaku secara bersamaan, menggunakan operasi aritmetika yang sesuai.
  • Laporkan akurasi dari heuristik gabungan tersebut.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Compute the mean of average_packet for bad sources
avg_bad_packet = np.mean(____[____]['average_packet'])

# Label as positive if average_packet is lower than that
pred_packet = ____[____] < avg_bad_packet

# Find indices where pred_port and pred_packet both True
pred_port = X_test['unique_ports'] > avg_bad_ports
pred_both = pred_packet ____ pred_port

# Ports only produced an accuracy of 0.919. Is this better?
print(accuracy_score(____, ____))
Edit dan Jalankan Kode