- OpenAI o1 to nowa seria modeli (rozpoczynająca się od o1-preview i o1-mini), skupiona na rozumowaniu w czasie rzeczywistym, a nie tylko na wstępnym uczeniu.
- o1 przewyższa GPT-4o w zadaniach STEM, zdobywając 83% na kwalifikacjach IMO w porównaniu do 13% GPT-4o i plasując się w 89. percentylu na Codeforces.
- o1 natywnie wykorzystuje rozumowanie łańcuchowe, przez co działa wolniej, ale jest znacznie dokładniejszy przy złożonych zadaniach.
- o1 jest znacznie trudniejszy do obejścia (jailbreak), uzyskując 84/100 w testach bezpieczeństwa, podczas gdy GPT-4o zdobył 22.
Po miesiącach spekulacji ze strony fanów ChatGPT, OpenAI wypuściło najnowszy model LLM Strawberry – i nie nazywa się GPT-5.
Wcześniej określany tajemniczymi nazwami kodowymi jak Q* czy Strawberry, najnowsza seria modeli ostatecznie otrzymała nazwę OpenAI o1.
Najważniejszą nowością w nowym modelu OpenAI są ulepszone umiejętności rozumowania. OpenAI wyjaśniło, że o1 został wytrenowany, by poświęcać więcej czasu na analizę niż wcześniejsze modele, zbliżając się tym samym do ludzkiej inteligencji.
Czym jest OpenAI o1?
OpenAI o1 to najnowsza seria dużych modeli językowych wydana przez OpenAI 12 września 2024 roku, obecnie obejmująca dwa modele: o1-preview i o1-mini.
Największą różnicą między o1 a wcześniejszymi modelami firmy jest zaawansowane rozumowanie. Choć pełna wersja nie została jeszcze wydana, już modele preview i mini znacznie przewyższają GPT-4o w testach z matematyki, nauk ścisłych i programowania.
Modele OpenAI o1
Wrześniowa premiera objęła dwa modele: o1-preview i o1-mini. To pierwsze z serii modeli, które będą dalej rozwijane wraz z udoskonalaniem nowego LLM przez OpenAI.
Różnica? Model o1-mini jest mniejszy i o 80% tańszy od wersji preview. Jest przeznaczony do zadań wymagających zaawansowanego rozumowania, ale nie szerokiej wiedzy. Idealnie sprawdza się przy zadaniach związanych z kodowaniem lub matematyką.
Jak inteligentny jest OpenAI o1?
OpenAI przedstawiło listę benchmarków STEM, które pokazują możliwości rozumowania o1, w tym:
- Podobne wyniki do doktorantów w testach z fizyki, chemii i biologii.
- Zajęcie miejsca wśród 500 najlepszych uczestników amerykańskich kwalifikacji do Olimpiady Matematycznej USA.
- 89. percentyl w Codeforces, konkursie programistycznym.
Więcej o możliwościach rozumowania o1 można przeczytać w publikacji badawczej OpenAI.
Czym jest rozumowanie łańcucha myśli?
Modele o1 wykorzystują rozumowanie łańcuchowe, czyli dokładniejszy i bardziej szczegółowy sposób analizowania poleceń.
Jeśli model o1 otrzyma polecenie, nie odpowie od razu – stąd dłuższy czas oczekiwania. Zamiast tego przeanalizuje każdy krok, dokładnie rozważając każdą informację i jej konsekwencje, zanim zdecyduje o dalszym działaniu. Odpowiedź pojawi się dopiero po przemyśleniu całego procesu.
Czym o1 różni się od GPT-4o?
1) Zdolności rozumowania
Kluczową cechą ogólnej inteligencji o1 jest jego nowa umiejętność rozumowania. „Być może najważniejsze postępy dotyczą właśnie zdolności rozumowania” – powiedział Altman Gatesowi. „Obecnie GPT-4 potrafi rozumować tylko w bardzo ograniczony sposób.”
Rozumowanie jest wyjątkowo trudne. Nawet dla ludzi. OpenAI o1 to pierwszy model, który się tego podejmuje.
Modele o1 potrafią rozumować w czasie rzeczywistym, a nie tylko polegać na danych z treningu. Dlatego nowy model lepiej radzi sobie z zadaniami z nauk ścisłych, matematyki i programowania niż wcześniejsze modele OpenAI.
2) Trudniejszy do obejścia (jailbreak)
Wraz ze wzrostem popularności i możliwości LLM, bezpieczeństwo stało się kluczowym aspektem najnowszych prac OpenAI. Firma współpracowała z amerykańskim i brytyjskim Instytutem Bezpieczeństwa AI podczas opracowywania serii o1, a także z rządem USA przy ustalaniu standardów bezpieczeństwa.
Seria o1 jest znacznie trudniejsza do obejścia niż wcześniejsze modele – to duży krok naprzód.
W jednym z najtrudniejszych testów jailbreakingu, model o1-preview uzyskał 84 na 100 punktów, podczas gdy GPT-4o tylko 22.
3) Nowa konwencja nazewnictwa
Choć nazwa nie jest najciekawszą cechą nowego LLM OpenAI, to jednak jest to celowa i znacząca zmiana.
OpenAI o1 to pierwszy model, który zrywa z nazwą 'GPT', ponieważ – jak twierdzi firma – to początek nowego 'paradygmatu rozumowania', podczas gdy starsze modele należały do 'paradygmatu wstępnego uczenia'.
Nowy model poświęca czas na rozumowanie w czasie rzeczywistym, zamiast polegać na danych z treningu.
4) Lepszy w rozwiązywaniu problemów STEM
Lepsze rozumowanie to także lepsze umiejętności matematyczne.
Zarówno o1, jak i GPT-4o miały rozwiązać egzamin kwalifikacyjny do Międzynarodowej Olimpiady Matematycznej. GPT-4o rozwiązał 13% zadań, a o1 aż 83%.
5) Dłuższy czas oczekiwania
Rozumowanie w czasie rzeczywistym trwa dłużej niż odwoływanie się do danych treningowych i generowanie odpowiedzi. Jeśli zadasz pytanie modelowi OpenAI o1-preview, w porównaniu do innych modeli, poczekasz znacznie dłużej.
Jednak możliwość korzystania z rozumowania w czasie rzeczywistym to niewielka cena do zapłacenia. Prędkość modeli o1 prawdopodobnie wzrośnie wraz z wydaniem kolejnych modeli z tej serii.
Kto może korzystać z o1?
Od 12 września użytkownicy ChatGPT Plus i Team mają dostęp do modeli o1 w ChatGPT.
OpenAI zapowiedziało, że udostępni o1-mini także użytkownikom darmowym, choć nie podano jeszcze daty.
Obecne tygodniowe limity to 30 wiadomości dla o1-preview i 50 dla o1-mini, ale wkrótce zostaną zwiększone.
Do czego warto używać o1?
Zaawansowane możliwości rozumowania o1 są szczególnie przydatne przy rozwiązywaniu złożonych problemów z matematyki, nauk ścisłych i programowania. Jak wyjaśnia OpenAI:
Ograniczenia OpenAI o1
Jako model w wersji preview, nie posiada jeszcze wszystkich funkcji GPT-4o. Jeśli chcesz korzystać z LLM do przeglądania internetu lub przesyłania plików czy obrazów, musisz pozostać przy GPT-4o do czasu wydania kolejnych wersji o1.
Jak zadawać polecenia OpenAI o1
Sugestie dotyczące tworzenia poleceń dla o1 różnią się od tych dla wcześniejszych modeli, ze względu na jego zaawansowane rozumowanie.
Formułuj polecenia prosto. To inteligentny model, nie wymaga tak szczegółowych wskazówek jak seria GPT-4. Oznacza to, że nie trzeba stosować rozbudowanych poleceń łańcuchowych – model już samodzielnie rozumuje.
Buduj agentów AI opartych na GPT
Co jeśli Twój agent AI automatycznie synchronizowałby się z każdą aktualizacją OpenAI?
Botpress to w pełni otwarta i rozbudowywalna platforma do tworzenia agentów AI. Nasz stack pozwala deweloperom budować chatboty i agentów AI o dowolnych możliwościach, w każdym procesie.
Jako jedyna platforma obejmująca zarówno konfigurację low-code, jak i nieograniczoną możliwość dostosowania i rozbudowy, Botpress pozwala automatycznie korzystać z najnowszej wersji GPT w Twoim chatbotcie – bez żadnego wysiłku.
Rozpocznij budowę już dziś. To nic nie kosztuje.
Najczęstsze pytania
1. Co oznacza „o1”? Czy istnieje logika nazewnictwa dla przyszłych modeli (np. o2, o3)?
Nazwa „o1” najprawdopodobniej oznacza „OpenAI 1”, czyli początek nowej rodziny modeli. Na tej podstawie można się spodziewać kolejnych nazw w sekwencji, takich jak „o2”, „o3” itd. dla przyszłych wersji tej serii.
2. Dlaczego OpenAI odeszło od konwencji nazewnictwa „GPT”?
OpenAI zmieniło konwencję nazewnictwa z „GPT” na „o1”, by podkreślić zmianę priorytetów – z ogólnych modeli językowych trenowanych wstępnie na modele zoptymalizowane pod kątem rozumowania w czasie rzeczywistym i interaktywności.
3. Czy OpenAI o1 to następca GPT-4, czy zupełnie nowa linia produktów?
OpenAI o1 nie jest bezpośrednim następcą GPT-4, lecz początkiem nowej linii produktów zaprojektowanej wokół rozumowania w czasie rzeczywistym i wydajności, choć bazuje na osiągnięciach GPT-4 i GPT-4o.
4. Czy o1 lepiej radzi sobie z wielojęzycznymi poleceniami niż GPT-4?
OpenAI nie podało oficjalnych informacji o porównaniu o1 z GPT-4 pod względem obsługi wielu języków, ale ponieważ o1 jest zoptymalizowany pod kątem rozumowania i nowych możliwości, kolejne wersje mogą jeszcze lepiej radzić sobie z wielojęzycznymi poleceniami.
5. Kiedy o1 będzie ogólnie dostępny dla użytkowników darmowej wersji?
OpenAI potwierdziło, że wersja o nazwie „o1-mini” zostanie udostępniona użytkownikom darmowego planu, jednak na ten moment nie ogłoszono oficjalnej daty ogólnej dostępności.





.webp)
