Membongkar Transformer
Arsitektur transformer telah merevolusi pemodelan urutan, dengan mengintegrasikan banyak kemajuan dalam deep learning, seperti penyandian posisi, mekanisme atensi, dan masih banyak lagi.
Komponen mana dari arsitektur transformer yang bertanggung jawab menangkap informasi tentang posisi setiap token dalam urutan?
Latihan ini merupakan bagian dari kursus
Model Transformer dengan PyTorch
Latihan interaktif langsung
Ubah teori menjadi aksi dengan salah satu latihan interaktif kami
Mulai latihan