Fazendo prompts com arquivos de imagem locais

Você está trabalhando como analista de dados no departamento de transporte de Londres. Sua equipe criou uma visualização que mostra o número de veículos nas vias em diferentes horários e modos de transporte, e você quer usar um modelo de IA para extrair insights principais a partir dela.

A imagem está armazenada localmente como "LDN_2024_traffic.png".

Crédito de imagem e dados: City Streets 2025 Summary Report by the City of London.

Este exercicio faz parte do curso

Trabalhando com a OpenAI Responses API

Instruções do exercicio

Importe o módulo base64 para codificar a imagem.
Codifique o arquivo de imagem em base64 usando a função b64encode() de base64, armazenando o resultado em image_base64.
Complete a mensagem de entrada da imagem na solicitação para indicar o uso de base64 e usar as codificações base64.

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Import base64 module
____

# Encode the image file as base64
with open(image_path, "rb") as f:
    image_base64 = base64.____(f.read()).decode("utf-8")

# Create a response with text and image input
response = client.responses.create(
    model="gpt-5.4-mini",
    input=[
        {"role": "user", "content": [
            {"type": "input_text", "text": "What mode of transport contributed the highest number of vehicles during business hours? Answer very concisely."},
            {"type": "input_image", "image_url": f"data:image/png;____,{____}"}
        ]}
    ]
)

print(response.output_text)
visualize_image(image_url)

Editar e Executar Código

Este exercicio faz parte do curso

Trabalhando com a OpenAI Responses API

IntermediárioNível de habilidade

4.8+

Comece o curso gratuitamente

Criar aplicações de IA nunca foi tão fácil com a Responses API! Aprenda a orientar modelos usando uma interface simples, as melhores práticas para trabalhar com modelos de raciocínio e como construir conversas de ida e volta com LLMs.

Exercise 1: Responses API: a melhor amiga do desenvolvedor Exercise 2: Sua primeira chamada à Responses API Exercise 3: Adicionando instruções ao modelo Exercise 4: Extraindo informações da resposta Exercise 5: Dominando os parâmetros de resposta Exercise 6: Experimentando modelos mais poderosos Exercise 7: Raciocinando sobre o Raciocínio Exercise 8: Encadeamento de Conversas Exercise 9: De uma mensagem para outra Exercise 10: Ativando conversas de chat

LLMs são poderosos, mas ficam ainda melhores quando você adiciona ferramentas! Aprenda a integrar busca na web aos seus sistemas com LLM sem chaves de API ou credenciais adicionais. Descubra que ferramentas podem ser, bem... praticamente qualquer coisa! Crie suas próprias ferramentas para LLMs chamarem e irem além das capacidades básicas do modelo.

Exercise 1: Itens de resposta: os blocos de construção Exercise 2: Extraindo itens de saída e seus conteúdos Exercise 3: Usando Items para Tratamento Personalizado Exercise 4: Pesquisa na Web que Simplesmente Funciona Exercise 5: Combinando LLMs e busca na Web Exercise 6: Ganhando confiança com fontes de LLM Exercise 7: Ferramentas com Chamadas de Função: Definindo a Função Exercise 8: O fluxo de trabalho de ferramentas com chamada de função Exercise 9: Definindo uma função para converter fusos horários Exercise 10: Ferramentas com chamadas de função: o fluxo completo Exercise 11: Criando a definição de ferramenta da OpenAI Exercise 12: Integrando ferramentas de function calling

Leve seus sistemas com LLM do prova de conceito à produção com três paradigmas de design essenciais. Aprenda a gerar saídas estruturadas consistentes e confiáveis, como JSON, usando LLMs. Você também vai usar eventos semânticos para transmitir atualizações aos seus usuários, criando experiências interativas e agradáveis. Por fim, explore a multimodalidade e aprenda a combinar texto e imagens com os modelos GPT-5 da OpenAI.

Exercise 1: Gerando saídas estruturadas Exercise 2: Saídas consistentes, sempre!Exercise 3: Aninhando classes Pydantic Exercise 4: Streaming com eventos semânticos Exercise 5: Transmitindo respostas da OpenAI Exercise 6: Transmitindo eventos semânticos Exercise 7: Streaming com chamadas de função Exercise 8: Flexibilidade de entrada e multimodalidade Exercise 9: Entradas baseadas em função (Role-Based)Exercise 10: Criando prompts com imagens a partir de URLs Exercise 11: Fazendo prompts com arquivos de imagem locais

Exercicio Atual

Exercise 12: Parabéns!