Membongkar Transformer
Arsitektur transformer telah merevolusi pemodelan urutan, dengan mengintegrasikan banyak kemajuan dalam deep learning, seperti penyandian posisi, mekanisme atensi, dan masih banyak lagi.
Komponen mana dari arsitektur transformer yang bertanggung jawab menangkap informasi tentang posisi setiap token dalam urutan?
Latihan ini adalah bagian dari kursus
Model Transformer dengan PyTorch
Latihan interaktif praktis
Ubah teori menjadi tindakan dengan salah satu latihan interaktif kami.
Mulai berolahraga