Pelatihan, penyetelan, & umpan balik

Anda sedang mengerjakan proyek untuk mengembangkan model menggunakan teknik Reinforcement Learning melalui Umpan Balik Manusia (RLHF) guna mengoptimalkan kinerjanya dalam lingkungan dukungan pelanggan.

Manakah dari opsi berikut yang paling akurat menggambarkan proses RLHF?

Latihan ini merupakan bagian dari kursus

Konsep Large Language Models (LLM)

Latihan interaktif langsung

Ubah teori menjadi aksi dengan salah satu latihan interaktif kami

Latihan ini merupakan bagian dari kursus

Konsep Large Language Models (LLM)

SkillTag.level.beginnerSkillTag.label

4.8+

Mulai Kursus Gratis

Lanskap AI berkembang pesat, dan Large Language Models (LLM) berada di garis depan evolusi ini. Bab ini membahas bagaimana LLM mendorong kemajuan kecerdasan buatan yang menyerupai manusia dan mentransformasi industri melalui beragam penerapannya. Anda akan menelusuri tantangan dan kompleksitas yang terkait dengan pemodelan bahasa.

Exercise 1: Kebangkitan LLM dalam lanskap AI Exercise 2: Definisi LLM Exercise 3: LLM dalam lanskap AI Exercise 4: Aplikasi AI vs. LLM Exercise 5: Aplikasi dunia nyata Exercise 6: Aplikasi bisnis Exercise 7: Aplikasi multimodal Exercise 8: Otomatisasi tugas berbasis data Exercise 9: Tantangan pemodelan bahasa Exercise 10: Apa yang dapat dilakukan model bahasa?Exercise 11: Pembelajaran tugas-tunggal vs. multi-tugas

Bab ini menekankan kebaruan LLM dan kapabilitas yang muncul darinya sembari menguraikan berbagai teknik NLP untuk penyiapan data. Anda akan mempelajari tantangan dalam melatih LLM dan bagaimana fine-tuning dapat mengatasinya secara efektif. Anda juga akan memahami bagaimana teknik pembelajaran N-shot memungkinkan adaptasi yang efisien pada model pra-latih ketika berhadapan dengan data berlabel yang terbatas.

Exercise 1: Kebaruan LLM Exercise 2: Pemecahan masalah dengan LLM Exercise 3: Model tradisional vs. LLM Exercise 4: Gambaran umum tergeneralisasi tentang NLP Exercise 5: Persiapan data Exercise 6: Pra-pemrosesan dan representasi teks Exercise 7: Word embeddings dibanding bag-of-words Exercise 8: Fine-tuning Exercise 9: Tantangan dalam membangun LLM Exercise 10: Adaptasi model pra-latih Exercise 11: Pre-trained atau fine-tuned?Exercise 12: Teknik pembelajaran Exercise 13: Fine-tune sebuah model Exercise 14: N-shot learning

Di bab ini, Anda akan mempelajari komponen dasar untuk melatih sebuah LLM, seperti teknik pra-pelatihan. Anda juga akan memperoleh pemahaman intuitif tentang konsep kompleks seperti arsitektur transformer, termasuk mekanisme attention. Bab ini membahas teknik fine-tuning tingkat lanjut dan merangkum proses pelatihan untuk menyelesaikan sebuah LLM.

Exercise 1: Komponen dasar untuk melatih LLM Exercise 2: Bahasa bertopeng (masked language)Exercise 3: Prediksi kata berikutnya Exercise 4: Membangun dari nol Exercise 5: Pengenalan transformer Exercise 6: Hubungan antar kata yang berjauhan Exercise 7: Komponen transformer Exercise 8: Mekanisme attention Exercise 9: Fokus multi-head attention Exercise 10: Self vs. multi-head attention Exercise 11: Fine-tuning tingkat lanjut Exercise 12: Pelatihan end-to-end Exercise 13: Pelatihan, penyetelan, & umpan balik

Latihan Saat Ini

Exercise 14: Membangun sebuah LLM

Pada bab ini, kita menelaah pertimbangan utama saat melatih LLM, seperti ketersediaan data berskala besar, kualitas data, pelabelan yang akurat, dan implikasi dari data yang bias. Anda juga akan mengkaji berbagai risiko LLM seperti privasi data, isu etis, dan dampak lingkungan. Terakhir, bab ini diakhiri dengan membahas area riset yang sedang berkembang dan lanskap LLM yang terus berevolusi.

Exercise 1: Pertimbangan dan kekhawatiran terkait data Exercise 2: Apakah model Anda adil?Exercise 3: Tidak bias dan relevan Exercise 4: Layanan pelanggan sebuah bank Exercise 5: Kekhawatiran etis dan lingkungan Exercise 6: Penggunaan yang bertanggung jawab Exercise 7: Etika dan lingkungan Exercise 8: Ke mana arah perkembangan LLM?Exercise 9: Kreativitas vs. efisiensi Exercise 10: Menganalisis karya sastra Exercise 11: Saatnya merangkum