A közlekedés hatékonyabbá tétele azért problémás, mert komoly kihívásokkal jár: előbb a folyamatról kell hatékony modell, amit aztán optimalizálhatunk. Az első feladatot nyolcsávos kereszteződés egyszerűsített modelljével kivitelezték: a jelzőlámpák csak piros és zöld fénnyel világítanak, a járművek csak egyenesen előre haladhatnak. Ezt követően megerősítéses tanulóalgoritmusokkal próbálták meghatározni a legtöbb rendszerszintű előnnyel járó jelzést, majd a mindkét irányban formálódó sorok hosszát számszerűsítették. Az algoritmusok megkísérelték minimalizálni a forgalmi sorok hosszát és csökkenteni a sofőrök várakozási ideit.
A megerősítéses tanulóalgoritmusokat mélytanulás-algoritmusokkal kombinálva jelentősen csökkent az optimalizált megoldások megtalálására fordított számítási idő.
A kutatók elmondták, hogy a megerősítéses mélytanulás-megoldások jelentősen túlszárnyalják a hagyományos megerősítéses tanulóalgoritmusokat, sokkal jobb eredményeket érnek el.