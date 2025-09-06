Kerek István, független mesterségesintelligencia-szakértő beszélgetésünk legelején felidézte, hogy az MI-vel még évtizedekkel ezelőtt a Mission: Impossible című filmben találkozott, amikor is az egyik jelenetben Tom Cruise bevetés közben pár centire megállt a padlótól. A filmben a CIA rendszerét a Thinking Machines Laptop 686 prototípusával törték fel, amelyben a történet szerint „mesterséges intelligencia-RISC-chip” működött.

Már a Mission:Impossible filmek egyikében is feltűnt évtizedekkel ezelőtt a mesterséges intelligencia. Forrás: Unsplash

A Terminátor-filmek már jóval sötétebb képet festettek számára az MI-ről és annak kockázatairól. Akkoriban ez még újdonság volt neki, később azonban komolyabban is e terület felé fordult, amikor 2004–2005 környékén egy volt általános iskolai osztálytársától – aki a Twitter, a mai X mérnöke volt – hallott arról az algoritmusról, amelynek köszönhetően videotelefonálni tudunk.

„2008-ban lettem tagja egy rendszámfelismerő rendszert készítő csapatnak.

Akkor ejtett rabul ez a terület, amikor láttam, hogy egy olyan monoton, robotisztikus tevékenységgel, amit korábban emberek végeztek, az MI remekül elboldogul.

Sőt, talán jobban is elboldogult a szövegfelismeréssel, mint az emberi munkaerő” – emlékezett vissza első munkájára a ChatGPT magyarul Facebook-csoport megalapítója. Hozzátette: a munkájukat és a terület fejlődését részben az is visszafogta, hogy akkoriban még nem álltak rendelkezésre kellően erős számítógépek és könnyen használható keretrendszerek.

Idővel azonban ez megváltozott, és a gépi látás területén is, ahol dolgozott, komoly előre lépések történtek. Többek között a gépi gyártósoron is ki tudták szúrni, hogy hol és mikor várhatóak leállások, és a probléma bekövetkezte előtt be tudtak avatkozni, így sokkal termelékenyebbé vált a folyamat. Ezt követték a különféle automatizációs eljárásokkal és fordításokkal készült filmek, majd 2016-ban már a városnéző buszokon is a mesterséges intelligencia fordította le 16 nyelvre a tájékoztató szövegeket.

Sőt, azt is elárulta, hogy ő volt az első idehaza, aki TikTokon azt csinálta, hogy a felhasználói interakciókból, élő adásban generált valós időben videós tartalmat.

Ez a három dolog kell a mesterséges intelligenciához

Arra a kérdésünkre, hogy mi hozott igazi áttörést a 2020-as évek elején ezen a területen, Kerek azt felelte, hogy alapvetően három dolog szükséges a mesterséges intelligenciához:

számítási kapacitás,

nagy mennyiségű és jó minőségű adat,

szakember, aki tudja, mit kezdjen az előző kettővel – például képes megírni egy algoritmust

„Ez kicsit a tyúk vagy a tojás esete. Amíg nincs megfelelő számítási kapacitás és elegendő, jó minőségű adat, addig az MI sem tud fejlődni. 2006 és 2008 azért volt vízválasztó, mert megjelentek a GPU-kártyák és az AWS felhőszolgáltatása, amelyek megnyitották az utat, hogy a hétköznapi emberek számára is elérhetővé váljon a technológia. Az úgynevezett CUDA-kártyák előtt csak a nagyobb cégek és az egyetemek férhettek hozzá ehhez az infrastruktúrához.”

Aztán 2010-ben megjelentek olyan keretrendszerek, amelyek lehetővé tették, hogy „ne kelljen mindent a nulláról kezdeni”, hanem lehessen a szoftverek és hardverek mellett a fizikai eszközöket is fejleszteni. Később a transzformer-megoldások is piacra kerültek, amelyek lehetővé tették a nyelv sokkal hatékonyabb értelmezését.

„2022 után berobbant a ChatGPT, amit ma a köznyelv szinte magával az AI-val azonosít. A GPT rövidítés a Generative Pre-trained Transformer kifejezést takarja: a modell képes szöveget generálni, mivel egy hatalmas adathalmazon előzetesen betanították, és ezt a tudását alkalmazza az adott feladat megoldására. Még ugyanebben az évben, novemberben »szólt vissza« a ChatGPT: először csak szöveget írt, később pedig hangja is lett”.