Discover what makes the hottest deep learning architecture in AI tick! Learn about the components that make up Transformer models, including the famous self-attention mechanisms described in the renowned paper "Attention is All You Need."

Transformers con PyTorch

Desgranando el Transformer

Transformers en PyTorch

Embedding y codificación posicional

Crear embeddings de entrada

Crear codificaciones posicionales

Autoatención multi-cabeza

Implementación de multi-head attention

Empezando la clase MultiHeadAttentionClass

Añadir métodos a la clase MultiHeadAttention

The Building Blocks of Transformer Models

Design transformer encoder and decoder blocks, and combine them with positional encoding, multi-headed attention, and position-wise feed-forward networks to build your very own Transformer architectures. Along the way, you'll develop a deep understanding and appreciation for how transformers work under the hood.

Encoder transformers

Feed-forward sublayers

The encoder transformer layer

The encoder transformer body

Adding the transformer head

Decoder transformers

Designing a mask for self-attention

The decoder layer

Completing the decoder transformer

Encoder-decoder transformers

Adding cross-attention to the decoder layer

Constructing the encoder-decoder transformer

Congratulations!

Building Transformer Architectures

Profundiza en los LLMs y descubre cómo la arquitectura transformer ha revolucionado el deep learning y ha impulsado el auge de la IA generativa. En este curso, aprenderás a crear tu propia arquitectura transformer desde cero, componente a componente. Verás cómo codificar posiciones de tokens, realizar los cálculos del mecanismo de atención y construir componentes modulares de un transformer para tener mayor control sobre su funcionamiento interno. Pasa de cero a héroe de los LLMs hoy mismo.

<h2>Profundiza en la arquitectura Transformer</h2>
Los modelos transformadores han revolucionado el modelado de texto, impulsando el auge de la IA generativa al hacer posibles los grandes modelos de lenguaje (LLM) actuales. En este curso, se estudiarán los componentes clave de esta arquitectura, incluyendo la codificación posicional, los mecanismos de atención y las subcapas de alimentación directa. Programarás estos componentes de forma modular para construir tu propio transformador paso a paso.<br><br><h2>Implementar mecanismos de atención con PyTorch</h2>
El mecanismo de atención es un avance clave que contribuyó a formalizar la arquitectura del transformador. La autoatención permite a los transformadores identificar mejor las relaciones entre los tokens, lo que mejora la calidad del texto generado. Aprende a crear una clase de mecanismo de atención multitesta que constituirá un elemento fundamental en tus modelos de transformador.<br><br><h2>Construye tus propios modelos de Transformers</h2>
Aprende a crear modelos de transformadores solo codificadores, solo decodificadores y codificadores-decodificadores. Aprende a elegir y codificar estas diferentes arquitecturas de transformadores para distintas tareas lingüísticas, como la clasificación de textos y el análisis de opiniones, la generación y finalización de textos, y la traducción secuencia a secuencia.

Deep Learning for Text with PyTorch

¿Qué impulsa a los LLM? Descubre cómo los transformadores revolucionaron el modelado de texto.

Modelos Transformer con PyTorch

¿Por qué triunfan los LLM? Descubre cómo los transformadores revolucionaron el modelado de texto e impulsaron el auge de la IA generativa.

Aprendizaje profundo en Python

Desarrollar grandes modelos lingüísticos

Desgranando el Transformer

Modelos Transformer con PyTorch

Ejercicio interactivo práctico