ComenzarEmpieza gratis

Modelos de lenguaje visual (VLM) con indicaciones

En los dos ejercicios siguientes, utilizarás un modelo multimodal para analizar el sentimiento de un artículo de noticias y su imagen de titular correspondiente del conjunto de datos BBC News en Hugging Face:

Ficha de datos de BBC News

Para empezar, prepararás una plantilla de chat para el modelo que incluya tanto la imagen como el artículo de noticias. Se han cargado el conjunto de datos (dataset) y la imagen principal (image).

Este ejercicio forma parte del curso

Modelos multimodales con Hugging Face

Ver curso

Instrucciones del ejercicio

  • Carga el contenido del artículo de noticias (content) desde el punto de datos en el índice 6 en dataset.
  • Completa la consulta de texto para insertar « content » en « text_query » utilizando cadenas f.
  • Añade image y text_query a la plantilla de chat, especificando el tipo de contenido de text_query como "text".

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Load the news article content from datapoint 6
content = ____

# Complete the text query
text_query = f"Does the news article have a positive, negative, or neutral impact on championship winning chances: {____}. Provide reasoning."

# Add the text query dictionary to the chat template
chat_template = [
    {
        "role": "user",
        "content": [
            {
                "type": "image",
                "image": ____,
            },
            ____
        ],
    }
]
Editar y ejecutar código