TL;DR: A OpenAI anunciou importantes atualizações em sua estrutura de preços para todos os seus modelos, incluindo a introdução do processamento flexível para requisições síncronas que promete reduzir significativamente os custos. A nova precificação apresenta diferenciação entre tipos de tokens (input, cached input e output) e oferece modelos “mini” como alternativas mais econômicas.

Takeaways:

O novo recurso de processamento flexível permite ajustar dinamicamente o uso de recursos computacionais, resultando em economia real para determinados tipos de carga de trabalho.
Modelos mais leves como gpt-4o-mini e gpt-4o-nano apresentam custos significativamente menores que suas versões completas, oferecendo alternativas econômicas.
A estrutura de preços agora diferencia entre input, cached input e output, permitindo economias ao reutilizar entradas semelhantes.
Para otimizar custos, recomenda-se utilizar o processamento flexível, considerar modelos “mini”, aproveitar o cached input e ajustar o contexto de busca conforme necessário.
O fine-tuning continua sendo uma opção para personalização, com preços variando significativamente entre modelos (de $0.80 por milhão de tokens para gpt-3.5-turbo até $25.00 para gpt-4o).

Atualização de Preços da OpenAI: Tudo que Você Precisa Saber para Otimizar seus Custos

Introdução

A OpenAI acaba de anunciar importantes atualizações em sua estrutura de preços, trazendo novidades que podem impactar significativamente seu orçamento e estratégia de implementação de IA. Se você utiliza modelos como GPT-4, DALL-E ou outras ferramentas da plataforma, estas mudanças afetarão diretamente seus custos operacionais. A boa notícia? Há oportunidades concretas para economizar.

Neste artigo, vamos destrinchar todas as alterações, desde a nova funcionalidade de processamento flexível até os preços detalhados por modelo. Você terá uma visão completa para tomar decisões informadas e otimizar seus investimentos em IA.

Novidade: Processamento Flexível para Economizar em Requisições Síncronas

A OpenAI introduziu um recurso revolucionário que promete reduzir significativamente os custos para determinados tipos de carga de trabalho: o processamento flexível para requisições síncronas.

Esta funcionalidade permite ajustar dinamicamente o uso de recursos computacionais, resultando em economia real para desenvolvedores e empresas. O sistema adapta inteligentemente a alocação de recursos com base na demanda, sem comprometer o desempenho.

Pontos-chave sobre o processamento flexível:

Disponível apenas em modelos selecionados (verifique as páginas específicas de cada modelo para detalhes)
Otimizado especificamente para requisições síncronas
Documentação completa disponível em: https://platform.openai.com/docs/guides/flex-processing

Para desenvolvedores que gerenciam aplicações com volumes significativos de requisições, esta funcionalidade pode representar uma redução substancial nos custos operacionais.

Preços Atualizados dos Modelos de Texto

A tabela a seguir detalha os preços dos modelos de texto por 1 milhão de tokens, diferenciando entre entrada (input), entrada em cache (cached input) e saída (output):

Modelo	Input	Cached Input	Output
gpt-4o	$2.50	$1.25	$10.00
gpt-4.1	$2.00	$0.50	$8.00
gpt-4o-mini	$0.25	$0.125	$1.00
gpt-4o-nano	$0.15	$0.075	$0.60
gpt-4.1-preview	$2.00	$0.50	$8.00

Esta estrutura de preços reflete diferentes capacidades e eficiências entre os modelos. O gpt-4o, por exemplo, tem um custo superior ao gpt-4o-mini, mas oferece recursos avançados que podem justificar o investimento para aplicações mais complexas.

A diferenciação entre input e cached input é particularmente relevante para aplicações que fazem requisições repetidas com os mesmos dados, permitindo economias significativas através do caching.

Modelos de Áudio: Preços e Considerações

Os modelos de áudio também receberam atualizações em sua estrutura de preços. Abaixo, os valores por 1 milhão de tokens:

Modelo	Input	Output
gpt-4o-audio-preview	$40.00	$80.00
gpt-4o-mini-audio-preview	$10.00	$20.00
gpt-4o-realtime-preview	$40.00	$80.00
gpt-4o-mini-realtime-preview	$10.00	$20.00

A diferença de preço entre as versões padrão e mini é significativa, tornando as versões mini uma opção atraente para aplicações com restrições orçamentárias. Contudo, é importante avaliar se o desempenho reduzido atende às necessidades específicas do seu caso de uso.

Para aplicações de transcrição de áudio em tempo real ou processamento de comandos de voz, os modelos realtime-preview oferecem capacidades especializadas que podem justificar o investimento adicional.

Modelos de Imagem: Estrutura de Preços

O recém-lançado GPT Image 1 apresenta uma estrutura de preços específica para processamento de imagens:

Modelo	Input	Output
GPT Image 1	$10.00	$40.00

É importante notar que estes preços não incluem os tokens de texto e imagem utilizados no processo de geração. Para DALL·E 2 e DALL·E 3, não há custos adicionais além dos tokens utilizados.

Esta estrutura de preços reflete a complexidade computacional envolvida no processamento e geração de imagens, especialmente considerando a capacidade do GPT Image 1 de compreender e interagir com conteúdo visual.

Fine-tuning: Investimento para Modelos Personalizados

O fine-tuning continua sendo uma opção poderosa para personalizar modelos conforme necessidades específicas. Os preços atualizados por 1 milhão de tokens são:

Modelo	Treinamento	Input	Cached Input	Output
gpt-4o	$25.00	$3.75	$1.875	$15.00
gpt-4.1	$20.00	$3.00	$0.75	$12.00
gpt-4o-mini	$3.00	$0.30	$0.15	$1.20
gpt-3.5-turbo	$0.80	$0.003	$0.0015	$0.006

O investimento em fine-tuning pode resultar em economias significativas a longo prazo, especialmente para aplicações com padrões de uso previsíveis e repetitivos. A versão gpt-4o-mini apresenta uma alternativa mais acessível para organizações com orçamentos limitados, enquanto o gpt-3.5-turbo continua sendo a opção mais econômica para casos de uso menos complexos.

Ferramentas Built-in: Code Interpreter e File Search

As ferramentas integradas da OpenAI também tiveram seus preços atualizados:

Code Interpreter:

$0.03 por sessão

File Search:

Armazenamento: $0.10 GB/dia (primeiro 1GB grátis)
Chamadas à ferramenta: $2.50 por 1k chamadas (Responses API)

Estas ferramentas complementam os modelos principais, oferecendo funcionalidades especializadas que podem aumentar significativamente a produtividade em determinados cenários. O Code Interpreter, por exemplo, é ideal para análise de dados e execução de código, enquanto o File Search otimiza a busca em documentos.

Web Search: Preços por Contexto e Modelo

A ferramenta de busca na web agora apresenta uma estrutura de preços variável, dependendo do modelo e do tamanho do contexto de busca:

gpt-4o:

Contexto baixo: $30.00 por 1k chamadas
Contexto médio (padrão): $35.00 por 1k chamadas
Contexto alto: $50.00 por 1k chamadas

gpt-4o-mini:

Contexto baixo: $25.00 por 1k chamadas
Contexto médio (padrão): $27.50 por 1k chamadas
Contexto alto: $30.00 por 1k chamadas

A opção de contexto influencia diretamente a quantidade e profundidade das informações recuperadas da web. Para consultas simples, o contexto baixo pode ser suficiente, enquanto pesquisas mais complexas podem se beneficiar do contexto alto, apesar do custo adicional.

Estratégias para Otimizar Custos com os Novos Preços

Com base nas atualizações de preços, aqui estão algumas estratégias para otimizar seus custos:

Utilize o processamento flexível sempre que possível para requisições síncronas
Considere modelos “mini” para tarefas menos complexas
Aproveite o cached input para requisições repetitivas
Ajuste o contexto de busca na web conforme a complexidade da consulta
Avalie o fine-tuning para casos de uso recorrentes e específicos

Implementar estas estratégias pode resultar em economias significativas sem comprometer a qualidade das respostas ou a experiência do usuário.

Conclusão: Preparando-se para o Futuro

As atualizações de preços da OpenAI refletem a evolução contínua da tecnologia de IA e a busca por um equilíbrio entre acessibilidade e desempenho. A introdução do processamento flexível e a diversificação das opções de modelos demonstram um compromisso com a otimização de custos e a flexibilidade para diferentes casos de uso.

Para desenvolvedores e empresas, estas mudanças representam tanto desafios quanto oportunidades. Compreender a estrutura de preços e implementar estratégias de otimização será crucial para maximizar o retorno sobre o investimento em tecnologias de IA.

Recomendamos revisar regularmente sua implementação atual, identificar oportunidades para migrar para modelos mais eficientes em termos de custo e experimentar o processamento flexível para avaliar seu impacto em seus casos de uso específicos.

Você está preparado para aproveitar estas mudanças? Compartilhe suas experiências e estratégias nos comentários abaixo.

Referências

Fonte: OpenAI. “Atualizações de Preços para Modelos e Ferramentas”. Disponível em: https://platform.openai.com/pricing.

Atualização de Preços OpenAI: Novidades e Economia