- OpenAI o1 é uma nova série de modelos (começando com o o1-preview e o o1-mini) focada em raciocínio em tempo real, não apenas em pré-treinamento.
- o1 supera o GPT-4o em tarefas de STEM, alcançando 83% nos qualificatórios da IMO contra 13% do GPT-4o, e está no percentil 89 no Codeforces.
- o1 utiliza raciocínio em cadeia de pensamento de forma nativa, o que o torna mais lento, mas muito mais preciso em tarefas complexas.
- o1 é muito mais difícil de ser burlado, atingindo 84/100 em testes de segurança adversariais, enquanto o GPT-4o marcou 22.
Após meses de especulação dos fãs do ChatGPT, o mais recente LLM Strawberry da OpenAI foi lançado – e não se chama GPT-5.
Anteriormente chamado por codinomes enigmáticos como Q* e Strawberry, a nova série de modelos finalmente recebeu o nome OpenAI o1.
A maior novidade do novo modelo da OpenAI é sua habilidade aprimorada de raciocínio. A OpenAI explicou que o o1 foi treinado para dedicar mais tempo pensando do que os modelos anteriores, aproximando-se mais da inteligência humana.
O que é o OpenAI o1?
OpenAI o1 é a mais recente série de grandes modelos de linguagem lançada pela OpenAI em 12 de setembro de 2024, atualmente composta por dois modelos: o1-preview e o o1-mini.
A principal diferença entre o o1 e os modelos anteriores da empresa é seu raciocínio avançado. Embora ainda não tenha sido lançado em sua versão completa, os modelos preview e mini já superam o GPT-4o em testes de matemática, ciência e programação.
Modelos OpenAI o1
O lançamento de setembro incluiu dois modelos, o o1-preview e o o1-mini. Eles são os primeiros de uma série de modelos que continuarão sendo lançados à medida que a OpenAI aprimora seu novo LLM.
A diferença? O modelo o1-mini é menor e 80% mais barato que o modelo preview. Ele foi criado para tarefas que exigem raciocínio avançado, mas não conhecimento amplo. É ideal para tarefas que envolvem programação ou matemática.
Quão inteligente é o OpenAI o1?
A OpenAI destacou uma série de benchmarks em STEM que demonstram as habilidades de raciocínio do o1, incluindo:
- Desempenho semelhante ao de estudantes de doutorado em testes de física, química e biologia.
- Ficando entre os 500 melhores estudantes nos qualificatórios dos EUA para a Olimpíada de Matemática dos EUA.
- Classificação no percentil 89 no Codeforces, um teste competitivo de programação.
Você pode saber mais sobre as habilidades de raciocínio do o1 no relatório de pesquisa da OpenAI.
O que é raciocínio em cadeia de pensamento?
Os modelos o1 utilizam raciocínio em cadeia de pensamento, uma forma mais longa e detalhada de decompor solicitações.
Se o modelo o1 receber um comando, ele não responderá imediatamente – por isso o tempo de espera maior. Em vez disso, ele irá raciocinar sobre cada etapa, considerando cuidadosamente cada informação e suas implicações antes de decidir o próximo passo. Ele só dará uma resposta depois de analisar toda a sequência de etapas necessárias para a tarefa.
Em que o o1 é diferente do GPT-4o?
1) Habilidades de raciocínio
No centro de sua inteligência geral está a nova capacidade de raciocínio do o1. “Talvez as áreas mais importantes de progresso estejam relacionadas à habilidade de raciocinar”, disse Altman a Gates. “Atualmente, o GPT-4 consegue raciocinar apenas de formas extremamente limitadas.”
Raciocinar é notoriamente difícil. Até mesmo para humanos. E o OpenAI o1 é o primeiro modelo a reivindicar essa capacidade.
Os modelos o1 conseguem raciocinar em tempo real, em vez de depender apenas de dados de pré-treinamento. Por isso, o novo modelo é melhor em tarefas de ciência, matemática e programação do que os modelos anteriores da OpenAI.
2) Mais difícil de burlar
Com o aumento das preocupações de segurança à medida que os LLMs se tornam mais populares e poderosos, a segurança foi um foco central no desenvolvimento do o1. A empresa fez parcerias com os Institutos de Segurança em IA dos EUA e do Reino Unido durante o desenvolvimento da série o1, além de trabalhar com o governo americano para garantir as devidas diligências.
Como um grande avanço, a série o1 é muito mais difícil de ser burlada – ou seja, de contornar as medidas de segurança – do que os modelos anteriores.
Em um dos testes de jailbreak mais difíceis, o modelo o1-preview marcou 84 de 100, enquanto o GPT-4o ficou com apenas 22.
3) Nova convenção de nomes
Embora o nome não seja o aspecto mais empolgante do novo LLM da OpenAI, ele representa uma mudança proposital e significativa.
OpenAI o1 é o primeiro modelo a abandonar o nome 'GPT', pois a empresa afirma que é a primeira fase de um novo 'paradigma de raciocínio', enquanto os modelos anteriores faziam parte do 'paradigma de pré-treinamento'.
O novo modelo dedica tempo ao raciocínio em tempo real, em vez de depender apenas dos dados de pré-treinamento.
4) Melhor em tarefas de resolução de problemas de STEM
Com melhor raciocínio, vêm melhores habilidades matemáticas.
Tanto o o1 quanto o GPT-4o foram desafiados a completar um exame qualificatório para a Olimpíada Internacional de Matemática. O GPT-4o resolveu 13% dos problemas, enquanto o o1 resolveu 83%.
5) Tempo de espera maior
Raciocinar em tempo real leva mais tempo do que apenas consultar dados de treinamento e gerar uma resposta. Se você fizer uma pergunta ao OpenAI o1-preview em comparação com outros modelos, terá que esperar bem mais.
No entanto, com a possibilidade de delegar o raciocínio, esse é um pequeno preço a pagar. A velocidade dos modelos o1 provavelmente vai melhorar à medida que novos modelos da série forem lançados.
Quem pode usar o o1?
Desde 12/09, usuários do ChatGPT Plus e Team já podem acessar os modelos o1 no ChatGPT.
A OpenAI anunciou que vai disponibilizar o o1-mini para usuários gratuitos, embora ainda não tenha definido uma data.
Os limites semanais atuais são de 30 mensagens para o 01-preview e 50 para o o1-mini, mas em breve esses limites serão aumentados.
Para que devo usar o o1?
As capacidades aprimoradas de raciocínio do o1 são especialmente úteis para resolver problemas complexos em matemática, ciência e programação. Como a OpenAI explica:
Limitações do OpenAI o1
Como está em versão preview, este modelo ainda não possui todas as capacidades do GPT-4o. Se você quer usar um LLM para navegar na web em busca de informações, ou deseja enviar arquivos ou imagens, será necessário continuar usando o GPT-4o até que versões mais avançadas do o1 sejam lançadas.
Como criar prompts para o OpenAI o1
As recomendações de prompts da OpenAI mudaram para o o1 em relação aos modelos anteriores, devido ao seu raciocínio aprimorado.
Mantenha seus prompts simples. É um modelo inteligente e não precisa de tanta orientação quanto a série GPT-4. Ou seja, evite inserir raciocínio em cadeia – o modelo já faz isso internamente.
Crie agentes de IA com tecnologia GPT
E se seu agente de IA sincronizasse automaticamente com cada atualização da OpenAI?
O Botpress é uma plataforma de agentes de IA totalmente aberta e extensível. Nossa stack permite que desenvolvedores criem chatbots e agentes de IA com qualquer capacidade, em qualquer fluxo de trabalho.
A única plataforma que vai desde configuração low code até personalização e extensibilidade ilimitadas, o Botpress permite que você aproveite automaticamente o poder da versão mais recente do GPT no seu chatbot – sem esforço.
Comece a construir hoje mesmo. É grátis.
Perguntas frequentes
1. O que significa “o1”? Existe uma lógica de nomenclatura para os próximos modelos (ex: o2, o3)?
O nome “o1” provavelmente significa “OpenAI 1”, indicando o início de uma nova família de modelos. Com base nisso, é razoável esperar nomes sequenciais como “o2”, “o3” etc. para as próximas versões dessa série.
2. Por que a OpenAI deixou de usar a convenção de nomes “GPT”?
A OpenAI mudou da convenção de nomes “GPT” para “o1” para sinalizar uma mudança de foco – de modelos de linguagem pré-treinados gerais para modelos otimizados para raciocínio em tempo real e capacidades interativas.
3. O OpenAI o1 é o sucessor do GPT-4 ou uma linha de produto totalmente nova?
O OpenAI o1 não é um sucessor direto do GPT-4, mas representa o início de uma nova linha de produtos focada em raciocínio em tempo real e eficiência, embora aproveite os avanços do GPT-4 e GPT-4o.
4. O o1 lida melhor com entradas em vários idiomas do que o GPT-4?
A OpenAI não declarou oficialmente como o o1 se compara ao GPT-4 em desempenho multilíngue, mas como o o1 é otimizado para raciocínio e novas capacidades, é possível que versões futuras lidem ainda melhor com entradas em vários idiomas.
5. Quando o o1 estará disponível para usuários do plano gratuito?
A OpenAI confirmou que uma versão chamada “o1-mini” será lançada para usuários do plano gratuito, mas até o momento não há uma data oficial anunciada para disponibilidade geral.





.webp)
