Modelos de lenguaje visual (VLM) con indicaciones
En los dos ejercicios siguientes, utilizarás un modelo multimodal para analizar el sentimiento de un artículo de noticias y su imagen de titular correspondiente del conjunto de datos BBC News en Hugging Face:

Para empezar, prepararás una plantilla de chat para el modelo que incluya tanto la imagen como el artículo de noticias. Se han cargado el conjunto de datos (dataset) y la imagen principal (image).
Este ejercicio forma parte del curso
Modelos multimodales con Hugging Face
Instrucciones del ejercicio
- Carga el contenido del artículo de noticias (
content) desde el punto de datos en el índice6endataset. - Completa la consulta de texto para insertar «
content» en «text_query» utilizando cadenas f. - Añade
imageytext_querya la plantilla de chat, especificando el tipo de contenido detext_querycomo"text".
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Load the news article content from datapoint 6
content = ____
# Complete the text query
text_query = f"Does the news article have a positive, negative, or neutral impact on championship winning chances: {____}. Provide reasoning."
# Add the text query dictionary to the chat template
chat_template = [
{
"role": "user",
"content": [
{
"type": "image",
"image": ____,
},
____
],
}
]