- OpenAI o1 is een nieuwe modelreeks (te beginnen met o1-preview en o1-mini) die zich richt op real-time redeneren, niet alleen op voortraining.
- o1 presteert beter dan GPT-4o bij STEM-taken, met een score van 83% op IMO-kwalificatietoetsen tegenover 13% voor GPT-4o, en behoort tot de 89e percentiel op Codeforces.
- o1 gebruikt van nature chain-of-thought-redeneren, waardoor het trager is maar aanzienlijk nauwkeuriger bij complexe taken.
- o1 is veel moeilijker te misleiden, met een score van 84/100 op veiligheidstests tegenover 22 voor GPT-4o.
Na maanden van speculatie door ChatGPT-fans is de nieuwste Strawberry LLM van OpenAI gelanceerd – en hij heet niet GPT-5.
Eerder aangeduid met mysterieuze codenamen als Q* en Strawberry, heeft de nieuwste modelreeks nu definitief de naam OpenAI o1 gekregen.
De belangrijkste vernieuwing van het nieuwe model van OpenAI is het verbeterde redeneervermogen. OpenAI legt uit dat o1 is getraind om meer tijd te besteden aan nadenken dan eerdere modellen, waardoor het dichter bij menselijke intelligentie komt.
Wat is OpenAI o1?
OpenAI o1 is de nieuwste serie grote taalmodellen van OpenAI, uitgebracht op 12 september 2024, en bestaat momenteel uit twee modellen: o1-preview en o1-mini.
Het grootste verschil tussen o1 en eerdere modellen van het bedrijf is het geavanceerde redeneervermogen. Hoewel het model nog niet volledig is uitgebracht, overtreffen de preview- en mini-modellen GPT-4o nu al bij testen op wiskunde, wetenschap en programmeren.
OpenAI o1-modellen
De release in september bevatte twee modellen: de o1-preview en de o1-mini. Dit zijn de eerste in een reeks modellen die OpenAI verder zal ontwikkelen en uitbrengen.
Het verschil? Het o1-mini-model is kleiner en 80% goedkoper dan het preview-model. Het is bedoeld voor taken die geavanceerd redeneren vereisen, maar geen brede kennis. Ideaal voor bijvoorbeeld programmeer- of wiskundetaken.
Hoe slim is OpenAI o1?
OpenAI heeft een reeks STEM-benchmarks gedeeld die het redeneervermogen van o1 laten zien, waaronder:
- Een vergelijkbare prestatie als promovendi op benchmarktoetsen voor natuurkunde, scheikunde en biologie.
- Een plek bij de top 500 studenten in de Amerikaanse kwalificatieronde voor de USA Math Olympiad.
- Een score in het 89e percentiel op Codeforces, een competitieve programmeertest.
Lees meer over het redeneervermogen van o1 in OpenAI's onderzoeksrapport.
Wat is keten-van-gedachten-redeneren?
De o1-modellen gebruiken chain of thought-redeneren: een langere en grondigere manier om verzoeken te analyseren.
Als het o1-model een prompt krijgt, geeft het niet direct antwoord – vandaar de langere wachttijd. Het redeneert stap voor stap, overweegt zorgvuldig alle informatie en gevolgen voordat het een volgende stap kiest. Het geeft pas antwoord als het het hele proces heeft doorlopen.
Hoe verschilt o1 van GPT-4o?
1) Redeneervermogen
Centraal in de algemene intelligentie van o1 staat het nieuwe redeneervermogen. “Misschien zijn de belangrijkste verbeteringen op het gebied van redeneren,” vertelde Altman aan Gates. “Op dit moment kan GPT-4 maar op zeer beperkte manieren redeneren.”
Redeneren is berucht lastig. Zelfs voor mensen. En OpenAI o1 is het eerste model dat dit claimt te kunnen.
De o1-modellen kunnen in real time redeneren, in plaats van alleen op voorgetrainde data te vertrouwen. Daarom presteert het nieuwe model beter bij wetenschap, wiskunde en programmeertaken dan eerdere OpenAI-modellen.
2) Moeilijker te misleiden
Nu LLM's steeds populairder en krachtiger worden, is veiligheid een belangrijk aandachtspunt bij de nieuwste ontwikkeling van OpenAI. Het bedrijf werkte samen met de Amerikaanse en Britse AI Safety Institutes en met de Amerikaanse overheid om hun zorgvuldigheid te waarborgen.
Een grote stap vooruit is dat de o1-serie veel moeilijker te misleiden is – dus om veiligheidsmaatregelen te omzeilen – dan eerdere modellen.
Bij een van hun moeilijkste jailbreak-tests scoorde het o1-preview-model 84 van de 100 punten, tegenover slechts 22 voor GPT-4o.
3) Nieuwe naamgeving
Hoewel de naam niet het spannendste is aan het nieuwe OpenAI LLM, is het wel een bewuste en betekenisvolle verandering.
OpenAI o1 is het eerste model dat de 'GPT'-naam loslaat, omdat het volgens het bedrijf de eerste fase is van een geheel nieuw 'redeneerparadigma', terwijl de oudere modellen tot het 'voortrainingsparadigma' behoorden.
Het nieuwe model besteedt tijd aan real-time redeneren, in plaats van alleen te vertrouwen op voorgetrainde data.
4) Beter in STEM-probleemoplossing
Met beter redeneervermogen komen ook betere wiskundige vaardigheden.
Zowel o1 als GPT-4o kregen een kwalificatietoets voor de Internationale Wiskunde Olympiade. GPT-4o loste 13% van de problemen op, terwijl o1 83% wist op te lossen.
5) Langere wachttijd
Real-time redeneren kost meer tijd dan antwoorden genereren op basis van trainingsdata. Als je een vraag stelt aan OpenAI o1-preview, zul je langer moeten wachten dan bij andere modellen.
Maar dankzij de mogelijkheid om het redeneerwerk uit te besteden, is dat een kleine prijs om te betalen. De snelheid van de o1-modellen zal waarschijnlijk verbeteren naarmate er meer modellen in de serie verschijnen.
Wie kan o1 gebruiken?
Sinds 12 september hebben ChatGPT Plus- en Team-gebruikers toegang tot o1-modellen in ChatGPT.
OpenAI heeft aangekondigd dat o1-mini beschikbaar zal komen voor gratis gebruikers, maar er is nog geen datum bekendgemaakt.
De huidige wekelijkse limieten zijn 30 berichten voor o1-preview en 50 voor o1-mini, maar deze zullen binnenkort worden verhoogd.
Waarvoor moet ik o1 gebruiken?
De verbeterde redeneercapaciteiten van o1 zijn vooral nuttig voor het oplossen van complexe problemen in wiskunde, wetenschap en programmeren. Zoals OpenAI uitlegt:
Beperkingen van OpenAI o1
Omdat het een preview is, heeft dit model nog niet alle mogelijkheden van GPT-4o. Wil je een LLM gebruiken om op internet te zoeken of bestanden of afbeeldingen uploaden, dan moet je voorlopig bij GPT-4o blijven tot latere o1-modellen verschijnen.
Hoe geef je een prompt aan OpenAI o1?
De prompt-adviezen van OpenAI zijn aangepast voor o1 ten opzichte van eerdere modellen, vanwege het verbeterde redeneervermogen.
Houd je prompts eenvoudig. Het model is slim en heeft minder sturing nodig dan de GPT-4-serie. Vermijd dus chain of thought-instructies – het model redeneert al intern.
Bouw AI-agents op basis van GPT
Wat als je AI-agent automatisch synchroniseert met elke OpenAI-update?
Botpress is een volledig open en uitbreidbaar AI-agentplatform. Ons platform stelt ontwikkelaars in staat om chatbots en AI-agents te bouwen met elke gewenste functionaliteit, voor elk type workflow.
Het enige platform dat varieert van low-code installatie tot eindeloze aanpasbaarheid en uitbreidbaarheid: met Botpress beschik je automatisch over de kracht van de nieuwste GPT-versie in je chatbot – zonder extra moeite.
Begin vandaag nog met bouwen. Het is gratis.
Veelgestelde vragen
1. Waar staat “o1” voor? Is er een logica voor toekomstige modelnamen (bijv. o2, o3)?
De naam “o1” staat waarschijnlijk voor “OpenAI 1” en markeert het begin van een nieuwe modelreeks. Het is dus aannemelijk dat toekomstige versies “o2”, “o3”, enzovoort zullen heten.
2. Waarom is OpenAI afgestapt van de “GPT”-naamgeving?
OpenAI is overgestapt van de “GPT”-naamgeving naar “o1” om een verschuiving in focus aan te geven – van algemene voorgetrainde taalmodellen naar modellen die geoptimaliseerd zijn voor real-time redeneren en interactieve mogelijkheden.
3. Is OpenAI o1 de opvolger van GPT-4 of een geheel nieuwe productlijn?
OpenAI o1 is niet direct de opvolger van GPT-4, maar vormt het begin van een nieuwe productlijn die is ontworpen rond real-time redeneren en efficiëntie, hoewel het voortbouwt op de vooruitgang van GPT-4 en GPT-4o.
4. Kan o1 beter met meertalige input omgaan dan GPT-4?
OpenAI heeft niet officieel aangegeven hoe o1 zich verhoudt tot GPT-4 op het gebied van meertaligheid, maar omdat o1 is geoptimaliseerd voor redeneren en nieuwe mogelijkheden, is het mogelijk dat toekomstige versies nog beter met meertalige input omgaan.
5. Wanneer wordt o1 algemeen beschikbaar voor gratis gebruikers?
OpenAI heeft bevestigd dat er een versie genaamd “o1-mini” beschikbaar zal komen voor gratis gebruikers, maar tot nu toe is er nog geen officiële datum aangekondigd voor algemene beschikbaarheid.





.webp)
