Claude 3.5 Sonnet: O Novo Modelo da Anthropic que Supera Expectativas

A Anthropic lançou recentemente o Claude 3.5 Sonnet, seu modelo de médio porte que supera os concorrentes e até mesmo ultrapassa o modelo Claude 3 Opus da própria empresa em várias avaliações. Disponível gratuitamente no Claude.ai e no aplicativo Claude para iOS, o Claude 3.5 Sonnet também pode ser acessado através da API da Anthropic, Amazon Bedrock e Google Cloud’s Vertex AI. O modelo é oferecido a $3 por milhão de tokens de entrada e $15 por milhão de tokens de saída, com uma janela de contexto de 200 mil tokens.

Benchmarks da Indústria

A Anthropic afirma que o Claude 3.5 Sonnet estabelece novos padrões na indústria para raciocínio em nível de pós-graduação (GPQA), conhecimento em nível de graduação (MMLU) e proficiência em codificação (HumanEval). O modelo demonstra capacidades aprimoradas em entender nuances, humor e instruções complexas, enquanto se destaca na produção de conteúdo de alta qualidade com um tom natural.

Capacidades Avançadas

Operando com o dobro da velocidade do Claude 3 Opus, o Claude 3.5 Sonnet é ideal para tarefas complexas, como suporte ao cliente sensível ao contexto e orquestração de fluxos de trabalho em várias etapas. Em uma avaliação interna de codificação agentic, ele resolveu 64% dos problemas, superando significativamente o Claude 3 Opus, que resolveu 38%.

Melhorias na Visão

O modelo também apresenta capacidades de visão aprimoradas, superando o Claude 3 Opus em benchmarks de visão padrão. Esse avanço é particularmente notável em tarefas que requerem raciocínio visual, como interpretação de gráficos e tabelas. O Claude 3.5 Sonnet pode transcrever com precisão textos de imagens imperfeitas, uma característica valiosa para indústrias como varejo, logística e serviços financeiros.

Novas Funcionalidades

Juntamente com o lançamento do modelo, a Anthropic introduziu o Artifacts no Claude.ai, uma nova funcionalidade que melhora a interação dos usuários com a IA. Essa funcionalidade permite que os usuários visualizem, editem e desenvolvam o conteúdo gerado pelo Claude em tempo real, criando um ambiente de trabalho mais colaborativo.

Compromisso com Segurança e Privacidade

Apesar do salto significativo em inteligência, o Claude 3.5 Sonnet mantém o compromisso da Anthropic com a segurança e privacidade. A empresa afirma: “Nossos modelos são submetidos a testes rigorosos e foram treinados para reduzir o uso indevido”. Especialistas externos, incluindo o Instituto de Segurança em IA do Reino Unido (UK AISI) e especialistas em segurança infantil da Thorn, foram envolvidos na testagem e refinamento dos mecanismos de segurança do modelo.

A Anthropic enfatiza sua dedicação à privacidade do usuário, declarando: “Nós não treinamos nossos modelos generativos com dados submetidos por usuários, a menos que o usuário nos dê permissão explícita para fazê-lo. Até o momento, não usamos nenhum dado de cliente ou usuário para treinar nossos modelos generativos.”

Planos Futuros

Olhando para o futuro, a Anthropic planeja lançar os modelos Claude 3.5 Haiku e Claude 3.5 Opus ainda este ano, completando a família de modelos Claude 3.5. A empresa também está desenvolvendo novas modalidades e funcionalidades para suportar mais casos de uso empresarial, incluindo integrações com aplicações empresariais e uma funcionalidade de memória para experiências de usuário mais personalizadas.