A kutatók a Wikipédia és az UMBC WebBase összes szócikkén, hárommilliárd angol szót tartalmazó adatsoron tanították rendszerüket. 300 ezernél több tárgykategóriára bukkant, és statisztikai összefüggéseket is fedezett fel közöttük. Például autókat és buszokat ismer fel, de a szóelemzésből rá is jön, hogy más járműkategóriákról van szó.
Már a kategóriák létezésének ismerete is sokat segít a tárgyfelismerésben. Jobb modellek dolgozhatók ki. A szóelemzésből kinyert információ ismeretlen tárgyak azonosítási módjában is segíthet. Például, a gép tudja, hogy néz ki egy alma, a szótár alapján viszont rájöhet, hogy a körte hasonló méretű, de hosszúkásabb.
Képzeljük el, hogy soha nem jártunk Afrikában, de könyvekből sejthetjük, mi vár ránk. Nagyjából – és lebutítva – így működik a Disney Research új tárgyfelismerése.