GPT-4o Mini: A Nova Fronteira da Inteligência Artificial de Baixo Custo

A OpenAI está dedicada a tornar a inteligência acessível a todos. Hoje, estamos anunciando o GPT-4o Mini, nosso modelo pequeno mais econômico. Esperamos que o GPT-4o Mini amplie significativamente o leque de aplicações construídas com IA, tornando a inteligência muito mais acessível. O GPT-4o Mini atinge 82% no MMLU e atualmente supera o GPT-4 em preferências de chat no LMSYS leaderboard. Seu preço é de 15 centavos por milhão de tokens de entrada e 60 centavos por milhão de tokens de saída, tornando-se uma ordem de magnitude mais acessível que os modelos anteriores e mais de 60% mais barato que o GPT-3.5 Turbo.

Vantagens e Aplicações do GPT-4o Mini

O GPT-4o Mini possibilita uma ampla gama de tarefas com seu baixo custo e latência, como aplicações que encadeiam ou paralelizam várias chamadas de modelos (por exemplo, chamando múltiplas APIs), passam um grande volume de contexto para o modelo (por exemplo, base de código completa ou histórico de conversas) ou interagem com clientes através de respostas rápidas em tempo real (por exemplo, chatbots de suporte ao cliente).

Leia mais: GPT-4o Mini: A Nova Fronteira da Inteligência Artificial de Baixo Custo

<!–more–>

Capacidades e Futuro do Modelo

Atualmente, o GPT-4o Mini suporta texto e visão na API, com suporte para entradas e saídas de texto, imagem, vídeo e áudio planejados para o futuro. O modelo possui uma janela de contexto de 128K tokens, suporta até 16K tokens de saída por solicitação e tem conhecimento até outubro de 2023. Graças ao tokenizador aprimorado compartilhado com o GPT-4o, lidar com texto em outros idiomas agora é ainda mais econômico.

Um pequeno modelo com inteligência textual superior e raciocínio multimodal. O GPT-4o Mini supera o GPT-3.5 Turbo e outros modelos pequenos em benchmarks acadêmicos, tanto em inteligência textual quanto em raciocínio multimodal, e suporta o mesmo conjunto de idiomas que o GPT-4o. Ele também demonstra um desempenho forte em chamadas de função, permitindo que os desenvolvedores construam aplicações que busquem dados ou tomem ações com sistemas externos, além de um desempenho melhorado em contextos longos em comparação com o GPT-3.5 Turbo.

O GPT-4o Mini foi avaliado em vários benchmarks importantes.

ChatGPT 4 mini benchmark
ChatGPT 4 mini benchmark
  • Tarefas de raciocínio: O GPT-4o Mini é superior a outros modelos pequenos em tarefas de raciocínio envolvendo texto e visão, atingindo 82.0% no MMLU, um benchmark de inteligência textual e raciocínio, em comparação com 77.9% para o Gemini Flash e 73.8% para o Claude Haiku.
  • Proficiência em matemática e codificação: O GPT-4o Mini se destaca em tarefas de raciocínio matemático e codificação, superando modelos pequenos anteriores no mercado. No MGSM, que mede o raciocínio matemático, o GPT-4o Mini atingiu 87.0%, comparado a 75.5% para o Gemini Flash e 71.7% para o Claude Haiku. O GPT-4o Mini alcançou 87.2% no HumanEval, que mede o desempenho em codificação, comparado a 71.5% para o Gemini Flash e 75.9% para o Claude Haiku.
  • Raciocínio multimodal: O GPT-4o Mini também mostra um desempenho forte no MMMU, uma avaliação de raciocínio multimodal, atingindo 59.4% em comparação com 56.1% para o Gemini Flash e 50.2% para o Claude Haiku.

Medidas de Segurança Integradas

A segurança está embutida em nossos modelos desde o início e reforçada em cada etapa do nosso processo de desenvolvimento. Durante o pré-treinamento, filtramos informações que não queremos que nossos modelos aprendam ou reproduzam, como discursos de ódio, conteúdo adulto, sites que agregam informações pessoais e spam. Durante o pós-treinamento, alinhamos o comportamento do modelo às nossas políticas usando técnicas como aprendizado por reforço com feedback humano (RLHF) para melhorar a precisão e confiabilidade das respostas do modelo.

O GPT-4o Mini possui as mesmas mitigações de segurança embutidas que o GPT-4o, que avaliamos cuidadosamente usando tanto avaliações automatizadas quanto humanas, de acordo com nosso Framework de Preparação e em linha com nossos compromissos voluntários. Mais de 70 especialistas externos em campos como psicologia social e desinformação testaram o GPT-4o para identificar potenciais riscos, os quais abordamos e planejamos compartilhar os detalhes no próximo cartão de sistema do GPT-4o e no scorecard de preparação. Insights dessas avaliações ajudaram a melhorar a segurança tanto do GPT-4o quanto do GPT-4o Mini.

Com base nessas aprendizagens, nossas equipes também trabalharam para melhorar a segurança do GPT-4o Mini usando novas técnicas informadas por nossa pesquisa. O GPT-4o Mini na API é o primeiro modelo a aplicar nosso método de hierarquia de instruções, que ajuda a melhorar a capacidade do modelo de resistir a jailbreaks, injeções de prompts e extrações de prompts do sistema. Isso torna as respostas do modelo mais confiáveis e ajuda a torná-lo mais seguro para uso em aplicações em larga escala.

Disponibilidade e Preços

O GPT-4o Mini está agora disponível como um modelo de texto e visão na Assistants API, Chat Completions API e Batch API. Os desenvolvedores pagam 15 centavos por 1M de tokens de entrada e 60 centavos por 1M de tokens de saída (aproximadamente o equivalente a 2500 páginas em um livro padrão). Planejamos lançar a personalização para o GPT-4o Mini nos próximos dias.

No ChatGPT, os usuários Free, Plus e Team poderão acessar o GPT-4o Mini a partir de hoje, em vez do GPT-3.5. Usuários empresariais também terão acesso a partir da próxima semana, em linha com nossa missão de tornar os benefícios da IA acessíveis a todos.

O Futuro da IA

Nos últimos anos, testemunhamos avanços notáveis na inteligência artificial combinados com reduções substanciais de custo. Por exemplo, o custo por token do GPT-4o Mini caiu 99% desde o text-davinci-003, um modelo menos capaz introduzido em 2022. Estamos comprometidos em continuar essa trajetória de redução de custos enquanto aprimoramos as capacidades dos modelos.

Enxergamos um futuro onde os modelos se tornam integrados de forma imperceptível em cada aplicativo e site. O GPT-4o Mini está pavimentando o caminho para os desenvolvedores construírem e escalarem aplicações de IA poderosas de forma mais eficiente e acessível. O futuro da IA está se tornando mais acessível, confiável e integrado em nossas experiências digitais diárias, e estamos entusiasmados em continuar liderando esse caminho.

DGO BANNER
[DiviShortcode id=”124517″]

ACORDEON ELEMENTAR 2
[DiviShortcode id=”124034″]

GRUPO ELEMENTAR
[DiviShortcode id=”124014″]

ACORDEON ELEMENTAR 1
[DiviShortcode id=”124006″]

CTA_DGO
[DiviShortcode id=”123525″]

SCD_YT_BTCURSO
[DiviShortcode id=”123523″]

BLOOM DGO
[DiviShortcode id=”123514″]