Szóval vissza kell térni a valódi beszélgetésekhez és valahogy ezeket lemásolni az AI és az ember közti kommunikációban. A feladat nem egyszerű, mert másolni a szabad asszociációkon alapuló és csapongó emberi beszédet (ami nemcsak hangok, hanem gesztusok és testbeszéd egymásra reflektáló sorozata) elég nagy kihívás. Maga az emberi kommunikáció (hétköznapi beszélgetésről és csetelésről van szó, nem prezentációról és egyetemi előadásokról vagyis egyirányú kommunikációról) többször is témát vált, soha nem lineáris, mint az eddigi gép-ember közti dialógusok.
Hogyan dolgozik a Siri mögötti intelligencia (vagy a Cortana és Google Now)? Szavakra keresnek, az emberi kifejezéseket és mondatokat ismétlik és keresnek hozzájuk megfeleltetéseket egy adatbázisból (ezt az adatbázist fejlesztik a „gazdáikkal" való beszélgetések közben). Az emberi beszélgetés dinamikáját kell tehát belecsempészni a gépi "intellektusba" valahogy. Ezen sokat segít, ha van egy olyan adatbázis, amibe töltelék szavakat teszünk (hogy az AI-nak legyen miből válogatnia, ha elakad), ha van miből az üresjáratokat kitöltenie a gépnek, ha megtanul időzíteni, mint egy ember. Ez pedig már a gépi tanulás birodalma. Vagyis tudjon a gép csendben "figyelni", ha akar közbe is szóljon, ha úgy véli az ember túl sokat és ugyanazt a gondolatkört ismétli folyamatosan (loop), kommentáljon, használjon testbeszédet, váltson témát stb. A kihívás nagy, de ha Chao és Thomaz és leendő kutató társaik sikerrel járnak, végre a digitális személyi asszisztenseink is „emberré" válhatnak valamennyire. Ez a lépés pedig teljesen átalakíthatja az ember és gép kapcsolatát majd a jövőben."