A jövő elérkezett: Elon Musk rászabadítja a világra a mesterséges intelligenciát

Kezdhetnek félni a programozók.

A GPT-5 az új korszak előhírnöke vagy az AI-boom maximuma?
„A technológiai világ figyelme pár napja ismét az OpenAI-ra szegeződött, amikor bemutatták a GPT-5-öt, azt a modellt, amelytől sokan a mesterséges intelligencia fejlődésének következő forradalmi fejezetét várták. A bemutatót kísérő megszokott hype és a „PhD-szintű szakértelmet” ígérő marketingszövegek azonban hamarosan egy mély, szinte tapintható zavarodottságnak adták át a helyüket. A felhasználók arra ébredtek, hogy a jól bevált, kreatív partnerként dicsért GPT-4o eltűnt, helyét pedig egyetlen, rejtélyes Auto mód vette át, amely önkényesen és sokszor következetlenül döntött a válaszok minőségéről és sebességéről. A kezdeti felháborodás és a gyors visszakozás, amellyel az OpenAI visszahozta a régi modelleket, sokakban azt a meggyőződést erősítette meg, hogy a nagy bejelentés valójában füst volt láng nélkül, csinosabb felhasználói felület és néhány felszínes integráció, de semmi, ami alapjaiban rengetné meg a gépi intelligencia határait. Megjelent több olyan értelmezés, például a New Yokerben, miszerint az AI-forradalom elérte a platóját és a fejlődés innentől csak a termékcsomagolásról szól. Egyre többször hallani olyan befektetői szakvéleményeket, hogy a mesterséges intelligencia körül olyan tőzsdei buborékot fújtak, ami a balul végződött ezredfordulós dotcom boomhoz hasonlítható és a vége is ugyanaz lesz. Elemzésünkben megvizsgáljuk, hogy valóban zsákutcába került-e mesterséges intelligencia-projekt vagy a GPT-5 körüli csalódottság nem a fejlődés végét, hanem éppen annak irányváltását jelzi.
A közelmúlt története fontos tanulságot hozott: az úgynevezett scaling law ígéretét sokáig axiómaként kezelte az iparág: ha nagyobb nyelvi modelleket építesz és nagyobb adathalmazon tanítod őket, sokkolóan jóvá válnak. E nézet látványos megerősítése volt a GPT-3 megjelenése, amely tízszer nagyobb volt a GPT-2-nél, és látványosan jobb is nála. Hirtelen kézzelfoghatónak tűnt az általános mesterséges intelligencia, az AGI, amely széles feladatkörben emberi szintű teljesítményt nyújt. Ha a skálázás törvénye tényleg tart, elég több pénzt és számítási kapacitást önteni a modellekbe, és odaérünk. Ebben a légkörben született Sam Altman »Moore’s Law for Everything« című bejegyzése is, amely szerint az AI átveszi az egyre több emberi munka elvégzését, és felfoghatatlan vagyonokat teremt a tőke tulajdonosainak. »Ez a technológiai forradalom feltartóztathatatlan« – írta, majd hozzátette, hogy a világ olyan gyorsan és drasztikusan változik, hogy ehhez hasonlóan drasztikus politikai változásokra lesz szükség a vagyonelosztás és az egyéni életesélyek fenntartása érdekében.
Annak megértéséhez, hogy a GPT-5 miért több egy egyszerű frissítésnél, először el kell ismernünk a kritikák jogosságát. Az a fejlesztői döntés, hogy egyetlen, automatizált rendszerbe vonják össze a korábbi, specializált modelleket, a gyakorlatban kudarcot vallott. A felhasználók, akik munkafolyamatokat építettek a GPT-4o villámgyors és kreatív ötleteire vagy más modellek mélyebb logikai képességeire, hirtelen egy kiszámíthatatlan partnerrel találták szemben magukat. A rendszer hol fölényes precizitással oldott meg bonyolult feladatokat, hol pedig bosszantóan leegyszerűsítő válaszokat adott, anélkül, hogy a felhasználónak érdemi ráhatása lett volna a folyamatra. Ez a következetlenség aláásta a bizalmat, és azt a látszatot keltette, hogy a felhasználói szabadság helyett a kényelmes, de butább automatizálás kap elsőbbséget. Hiba lenne azonban ebből arra következtetni, hogy a motorháztető alatt nem történt semmi. A standardizált, objektív mérőszámok mást mutatnak: az AIME, a matematikai érvelést vizsgáló, hírhedten nehéz teszt 94 százalék feletti eredménye nem csupán javulás a GPT-4o 40 százalék körüli teljesítményéhez képest, hanem minőségi ugrás, amely újfajta logikai és absztrakciós képességről tanúskodik. A valós szoftverfejlesztési feladatokat szimuláló SWE-bench közel 75 százalékos pontossága szintén azt mutatja, hogy a modell képes a kontextus mélyebb megértésére és többlépéses problémák megoldására. Ezek a számok nem elszigetelt sikerek, hanem egy mélyreható architekturális váltás tünetei.
A GPT-5 valódi újdonsága a Multi-Stage Model Routing. Ez a megközelítés a mesterséges intelligencia egyik alapkérdésére ad választ: hogyan lehet egyszerre gyors és okos. A korábbi modellek monolitikusak voltak, minden kérdésre, legyen bármilyen egyszerű, a teljes, gigantikus hálózat mozdult meg, ami pazarló számítási igénnyel járt. A GPT-5 ezzel szemben dinamikus, adaptív rendszerként működik. Valós időben méri fel a beérkező feladat komplexitását, és ennek megfelelően választ a belső, különböző méretű és képességű modellvariánsok közül. Egy egyszerű ténykérdésre kisebb, gyorsabb komponens felel, egy tudományos esszénél pedig aktiválódik a »gondolkodó« mód, amely több számítási erőforrást és időt szán a válasz kidolgozására. Ez nemcsak hatékonyságot hoz, hanem új skálázási logikát is kijelöl. Az iparág felismerte, hogy a scaling laws kifulladóban vannak, a modellek duplázása már nem hoz arányos teljesítménynyereséget, miközben a képzési költségek a csillagos égbe szöknek. A GPT-5 dinamikus architektúrája az első komoly kísérlet a spirálból való kitörésre, és szervesen rokon a MoE, a Mixture of Experts irányával, amely a specializált alhálózatok intelligens kiválasztásával okosabban, nem pedig pusztán nagyobban számol.
Az újfajta intelligencia ugyanakkor még mindig magán viseli a jelenlegi technológia gyermekbetegségeit. A hallucináció problémája, vagyis a tények magabiztos, de hamis állítása továbbra is kísért. Ahogy egy, a modellt éles rendszerben használó fejlesztő fogalmazott, a GPT-5 egyszerre »hihetetlenül okos«, miközben „olyan módokon hallucinál, ahogy azt leírni sem tudom”. Ez a kettősség rámutat a benchmarkok és a megbízható működés közötti szakadékra. A modell nem rendelkezik a saját tudásának határairól alkotott stabil képpel, ami váratlan pillanatokban vezethet téves következtetésekhez. Több ismert AI-kritikus szerint ez nem pusztán javítható hiba, hanem a jelenlegi transzformer-architektúrák strukturális hiányossága. Amíg a modellek statisztikai mintázatok alapján jósolják a következő szót belső, konzisztens világmodell nélkül, addig a valódi megértés és megbízhatóság korlátozott marad. A következő áttörés valószínűleg a neuroszimbolikus rendszerek felé mutat, ahol a neurális hálók intuitív mintázatfelismerését a szabályalapú logika szigora egészíti ki.
A piaci környezet értelmezéséhez jól látszik, hogy a verseny természete is változik. Tekintélyes gazdasági lapoknak nyilatkozó iparági kutatók szerint a cégek egyre inkább belátják, hogy nem csupán csillogó, egyre nagyobb modelleket építenek, hanem olyan, hosszú távon fenntartható infrastruktúrát, amelyre valódi termékek és szolgáltatások épülnek. Érthető, hogy ahogy az AI egyre több hasznos alkalmazásban jelenik meg, a fókusz az alkalmazásokra tolódik az olyan elvont ideák helyett, mint az általános MI.
A GPT-5 így hídként értelmezhető két korszak között. Egyrészt a nyers erőre épülő skálázási verseny csúcsteljesítménye, amely megmutatja, meddig lehet eljutni a jelenlegi paradigmán belül. Másrészt adaptív, dinamikus architektúrájával már a következő korszakot vetíti előre, ahol a hatékonyság és az erőforrásokkal való intelligens gazdálkodás kerül középpontba. A legnagyobb tévedés az AI platójáról szóló vitában az, ha az egész univerzumot a nagy nyelvi modellek szűk ablakán keresztül szemléljük. Míg a közbeszéd a ChatGPT-hez hasonló chatbotokról szól, az alapul szolgáló technológiák már rég átszivárogtak más tudományágakba, és ott indítottak el valódi forradalmakat. Ezeken a területeken nincs lassulás, a fejlődés exponenciális és lélegzetelállító.
A biológia és az anyagtudomány területén zajló csendes forradalom jó példa. A DeepMind AlphaFold modelljei, amelyek transzformer-architektúrára épülnek, példátlan pontossággal képesek modellezni fehérjék, DNS és más molekulák bonyolult háromdimenziós szerkezetét és kölcsönhatásait. Ez nem elvont tudományos érdekesség, hanem a modern gyógyszertervezés és a személyre szabott orvoslás alapköve, amely évekkel gyorsítja a kutatásokat. A Google GNoME rendszere gépi tanulással több mint kétmillió új, elméletileg stabil kristályszerkezetet azonosított, ami a felfedezett anyagok számát a sokszorosára növeli az emberiség eddigi történetéhez képest. Ezekben benne rejlik a hatékonyabb akkumulátorok és a jövő szupravezetőinek ígérete.
A vitához hozzátartozik a józan kétely is, különösen ha befektetői szempontból nézzük. Több iparági elemzés szerint a generatív AI piaca a következő években reálisan ötven-száz milliárd dolláros nagyságrend lehet, nem ezermilliárdos. A hatások nagyban attól függnek, hogy a vállalatok mennyire alakítják át a folyamataikat a technológia köré. Minél kritikátlanabb az átszervezés, annál nagyobb a melléfogások és a megtérülési csalódások kockázata. Ráadásul az amerikai részvénypiac értékének jelentős része az úgynevezett Magnificent Seven technológiai cégekhez kötődik, amelyek a következők: Apple, Microsoft, Alphabet, Amazon, Nvidia, Meta és Tesla. Miközben ezek a vállalatok az elmúlt időszakban hatalmas összegeket fordítottak AI-beruházásokra, a tényleges AI-bevételek ennél jóval szerényebbek voltak. Ha csak a számokat nézzük, könnyű elbizonytalanodni. A skálázási összefüggések ráadásul továbbra is részben rejtélyesek. Amíg működtek, minden egyszerűnek tűnt, aztán egy ponton már nem működtek. Józanabb megközelítésre van szükség kevesebb gőggel és több körültekintéssel.
Mindez azonban nem a forradalom végét jelzi, hanem azt, hogy irányt váltott. A jövő már nem az egyre nagyobb, monolitikus modellekről fog szólni, hanem a specializált, dinamikusan együttműködő rendszerekről, amelyek remélhetőleg egyre mélyebb belső reprezentációval rendelkeznek a világról. A GPT-5 ebben az átmenetben kulcsszereplő, bár nem hibátlan. Nem végcél, hanem elengedhetetlen állomás azon az úton, amely egy kifinomultabb, megbízhatóbb és valóban intelligens mesterséges intelligencia felé vezet. A kérdés már nem az, hogy a chatbot okosabb lett-e, hanem az, hogy milyen új tudományos és ipari áttöréseket tesz lehetővé a mögötte álló technológiai ökoszisztéma.A felszín alatt olyan technológiai átrendeződés zajlik, amely a nyers erő korszakának végét és az intelligens hatékonyság korának kezdetét vetíti előre, választ adva az iparág egyik legégetőbb kérdésére: merre tovább, ha a puszta méretnövelés már nem út.”
Nyitókép illusztráció. Fotó:
Ezt is ajánljuk a témában
Kezdhetnek félni a programozók.