„Egy program tavaly megvert egy világklasszis gojátékost, ami lenyűgöző, de tegyük magasabbra a mércét. A számítástudománynak a korlátainkon túlmutató szint eléréséhez nélkülözhetetlen eszközök fejlesztésében kellene segítenie. A godiadalban fontos szereplő megerősítéses tanulás felgyorsíthatja a folyamatot.
Ha megerősítéses tanulást használó mesterséges tanulóágenseket akarunk, adatokat intelligensen kezelő algoritmusok kellenek hozzájuk. Online oktatási rendszerekből összegyűjtött adatok segítségével az ágens felmérheti különféle tanítási megközelítések hatékonyságát. Mit tegyen, ha egy diák felcsatlakozik: a rendszer problémát oldasson meg vele, vagy mutasson neki magyarázó videót? Az adatok segítenek a döntéshozásban.
Egyes esetekben viszont nincs elég adat, vagy nem az a fajta, ami pont kell. Ezért is kihívás jó döntéseket hozó rendszerek fejlesztése. Az lenne a legjobb, ha olyat fejlesztenénk, amelynek nem kell sok adat. Stanfordi csoportommal pontosan ezen dolgozunk: számítógépeket kevesebb adat esetén is jó javaslatokkal támogató megerősítéses tanulásos algoritmusokat és statisztikai technikákat hozunk létre.
De a számítógépekre sem kell hagyni mindent. Felgyorsulhat a megerősítéses tanulás, ha ember is részt vesz benne. Szükség esetén tőle kér segítséget az algoritmus. Most pont oktatórendszerre írt algoritmust tesztelünk, hogy megállapítsa: a jelenlegi tanterv jobb tanulásra inspirálja a diákokat, vagy sem. Aztán tippeket kérünk az érintettektől.
Ez a fajta ember-gép együttműködés nagyon hasznos lehet a diákoknak. Mesterségesen intelligens ágensek újradefiniálják, milyen a kimagasló egyéni teljesítmény, és mindannyiunk számára lehetővé teszik, hogy elérjük ezt a teljesítményt.”