LeCun csapata többórányi videóval táplálja a rendszereket, és ennek során szándékosan kihagy egyes képkockákat, majd hagyja, hogy az MI megjósolja, mi fog történni ezután. Ezáltal gyakorlatilag úgy tanítják, akárcsak egy gyereket.
Azt is elmondta, hogy a Fair egy „univerzális szövegkódoló rendszer” létrehozását is tervezi, amely képes bármilyen szöveges információt feldolgozni és reprezentálni olyan formában, amely a különböző alkalmazások számára érthető és hasznosítható. Ez a rendszer különösen hasznos lehet a multimodális feldolgozásban, ahol a szöveges információt át lehet alakítani más formátumokká, például videóvá és hanggá. Egyes szakértők azonban kételkednek abban, hogy ez az elképzelés megvalósítható.
Aron Culotta, a Tulane Egyetem számítástechnika-docense szerint az ok-okozati összefüggések már régóta kihívást jelentenek a fejlesztések során, a rendszerek ezért is hajlamosak „hallucinálni” és tévesen válaszolni.
Hosszabb távon LeCun úgy véli, hogy a technológia olyan MI-asszisztenseket fog működtetni, amelyekkel a felhasználók okosszemüvegeken vagy elektromiográfiai eszközökön keresztül léphetnek kapcsolatba. Hozzátette, ahhoz, hogy ezek a virtuális asszisztensek valóban hasznosak legyenek, az emberhez hasonló intelligenciára van szükségük.
Az Apple-nek is nagy tervei vannak