„Na zakończenie 12-dniowego wydarzenia OpenAI zaprezentowało swoje największe ogłoszenie — nowy model będący punktem odniesienia dla rozumowania o3. Dzisiaj udostępniliśmy ewaluacje wczesnej wersji kolejnego modelu z naszej serii rozumowań o-modelu: OpenAI o3 pic.twitter.com/e4dQWdLbAD — OpenAI (@OpenAI) 20 grudnia 2024 r. Sieć neuronowa jest następcą o1. Pokazuje „nowe standardy możliwości programowania, matematyki i myślenia naukowego”. Jest nowy model […]„, informuje: businessua.com.ua
Na zakończenie 12-dniowego wydarzenia OpenAI zaprezentowało swoje największe ogłoszenie — nowy model będący punktem odniesienia dla rozumowania o3.
Dzisiaj udostępniliśmy oceny wczesnej wersji następnego model w naszej serii rozumowań o-model: OpenAI o3 pic.twitter.com/e4dQWdLbAD
— OpenAI (@OpenAI) 20 grudnia 2024 r
Sieć neuronowa jest następcą o1. Pokazuje „nowe standardy możliwości programowania, matematyki i myślenia naukowego”.
Nowy model jest przełomowy i wykazuje poprawę w najbardziej skomplikowanych testach – podkreślił współzałożyciel OpenAI Greg Brockman.
o3, nasz najnowszy model rozumowania, to przełom, z poprawą funkcji krokowej w naszych najtrudniejszych testach porównawczych. rozpoczynamy teraz testy bezpieczeństwa i tworzenie drużyn czerwonych. https://t.co/4XlK1iHxFK
— Greg Brockman (@gdb) 20 grudnia 2024 r
Wprowadzono także o3-mini, szybszą, zoptymalizowaną wersję o3. Będzie to pierwsza z linii, która zostanie udostępniona ogółowi społeczeństwa na początku 2025 roku.
Modele zorientowane na rozumowanie spędzają więcej czasu na odpowiadaniu i weryfikowaniu informacji. Dzięki temu możesz spodziewać się bardziej prawdziwych i dokładnych danych.
Po wydaniu o1 nastąpiła eksplozja „myślących sieci neuronowych”. Jak dowiedziały się media w październiku, Google zaczął pracować nad podobnym rozwiązaniem. W listopadzie chińskie laboratorium DeepSeek Lab zaprezentowało „konkurenta o1 z OpenAI”, „superpotężny” model rozumującej sztucznej inteligencji DeepSeek-R1-Lite-Preview. W tym samym miesiącu Alibaba ujawniła podobne narzędzie.
Model o3 jest w stanie zaplanować i wykonać serię działań przed udzieleniem odpowiedzi. OpenAI opisuje ten proces jako „budowanie łańcucha myślowego”. Innowacją jest możliwość „korygowania” czasu rozumowania. Sieć neuronową można skonfigurować pod kątem niskich, średnich lub wysokich obliczeń. Im wyższa wartość, tym lepsza i dłuższa odpowiedź.
BezpieczeństwoW grudniu eksperci ds. bezpieczeństwa odkryli, że o1 był bardziej podatny na oszukiwanie ludzi w porównaniu ze standardową wersją GPT-4o i modelami AI innych firm.
W nowo opublikowanym badaniu OpenAI przedstawiło metodę zapewniającą zgodność sieci neuronowych z wartościami firmy. Startup wykorzystał tę metodę, aby nauczyć o1 i o3 „myśleć” o polityce bezpieczeństwa podczas odpowiadania.
Zgodnie z oświadczeniem firmy podejście to poprawiło ogólną zgodność z zasadami firmy.
W porównaniu z GPT-4o i innymi nowoczesnymi modelami wielkojęzykowymi, o1 wyprzedza granicę Pareto, odmawiając odpowiadania na złośliwe zapytania i nie odrzucając łagodnych. Źródło: OpenAI.
Aby utworzyć „łańcuch myśli”, o1 i o3, po otrzymaniu prośby od użytkownika, poświęć kilka sekund lub minut na analizę problemu w jego częściach składowych. Aby poprawić bezpieczeństwo, OpenAI wyszkoliło sieć neuronową, aby dwukrotnie sprawdzała się, kładąc nacisk na swoje zasady.
GPT-5 OpenAI nie spełnił oczekiwańTymczasem The Wall Street Journal doniósł, że kolejny flagowy model, GPT-5, jest opóźniony, a wzrost wydajności nie uzasadnia ogromnych kosztów.
Nowa sieć neuronowa o kryptonimie Orion jest szkolona na ogromnej ilości danych.
Według doniesień OpenAI w procesie szkolenia swojej sztucznej inteligencji korzystała nie tylko z publicznie dostępnych informacji i umów licencyjnych. W szczególności wykorzystano dane syntetyczne utworzone przez o1.
Dla przypomnienia, w ramach 12-dniowego wydarzenia OpenAI zaprezentowało generator wideo AI Sora.
Źródło