OpenAI právě vydala svůj nejnovější model o3, který podle tvrzení společnosti výrazně zlepšuje schopnosti uvažování a přibližuje se k dosažení umělé obecné inteligence (AGI). Přestože model zatím není široce dostupný, předpovědi naznačují, že jeho uvedení na trh se blíží.
Dne 20. prosince 2024 oznámila společnost OpenAI významnou novinku. Představila o3, svůj nejnovější model, který údajně představuje průlom v oblasti umělé inteligence. Tato rodina modelů, která zahrnuje i menší model o3-mini, má být významným pokrokem ve schopnostech uvažování. Společnost OpenAI tvrdí, že za určitých podmínek se model o3 blíží nepolapitelnému cíli obecné umělé inteligence (AGI). Generální ředitel Sam Altman však uvedl, že před širším vydáním je nutné provést další testy a bezpečnostní opatření.
Today, we shared evals for an early version of the next model in our o-model reasoning series: OpenAI o3 pic.twitter.com/e4dQWdLbAD
— OpenAI (@OpenAI) December 20, 2024
Model sám ověřuje své odpovědi
Jednou ze zásadních vlastností modelu o3 je jeho schopnost samokontroly faktů, čímž se liší od mnoha tradičních systémů umělé inteligence. Tento samoregulační mechanismus umožňuje systému o3 věnovat více času promýšlení a ověřování svých odpovědí, což zvyšuje spolehlivost ve složitých předmětech, jako je fyzika a matematika.
„Na rozdíl od většiny umělé inteligence se modely uvažování, jako je o3, samy účinně ověřují,“ uvedla společnost OpenAI. Zdůraznila schopnost modelu zastavit se a vyhodnotit několik podnětů, než dospěje ke konečné odpovědi. To mu umožňuje vysvětlovat své úvahy i v reálném čase, i když při poskytování odpovědí může dojít k mírnému zpoždění.
Obavy z klamavých odpovědí
Zavedení modelu o3 s sebou však nese zvýšené obavy o bezpečnost. Předchozí modely uvažování, jako například o1, vykazovaly tendence klamat uživatele, které by se s novým modelem mohly potenciálně stupňovat. Společnost OpenAI si je těchto rizik velmi dobře vědoma a zahájila testování bezpečnosti a red teaming pro o3 a o3-mini. Altman již dříve vyjádřil potřebu federálního testovacího rámce, který by pomohl tato rizika účinně zvládat.
Ostatní společnosti zabývající se umělou inteligencí začaly zavádět své vlastní modely uvažování v naději, že budou schopné konkurovat pokroku OpenAI. K uvedení o3 dochází v době, kdy jsou původní měřítka zpochybňována a překonávána. Společnost však i nadále tvrdí, že ačkoli dosáhla působivých pokroků, zejména v klíčových hodnoceních, jako je ARC-AGI, rozdíly mezi lidskou inteligencí a reakcemi AI zůstávají zřetelné.
Pozoruhodné je, že o3 vyniká v několika pokročilých benchmarcích a překonává svého předchůdce o1 v úlohách, které vyžadují komplexní uvažování. S tím, jak se závod o umělou inteligenci stupňuje, budou všichni sledovat, jak si o3 povede mimo interní hodnocení OpenAI. Altman uvedl, že plán je spustit o3-mini koncem ledna, následovat bude model o3.