A Microsoft nem ül a babérjain, a Cortana-t most portolta az iOS alapú eszközökre és már egy újabb hasonló Custom Recognition Intelligence Service (CRIS) megoldáson dolgozik.
„Igaz ez a Siri féle megoldást akarja leginkább lemásolni, vagyis élő beszédből szeretne az azt pontosan visszaadó szöveget gyártani (speech2text). Be is mutatta az új alkalmazás 2 változatának API-ját (application programming interfaces) a fejlesztőknek. Az egyik egy hangfelismerő és azonosító algoritmus lesz, a másik az, ami az élőbeszédet írottra alakítja, ha minden igaz még ez évben béta verzió is kikerül belőlük. A fejlesztések mögött a kísérleti projekteket a redmondi cégnél végző Project Oxford stúdió áll, ez évben már egy remek mesterséges intelligenciás alkalmazással is előrukkolt (a képeken szereplő emberek érzelmi állapotát detektálta sikerrel az MI). Az API felismeri és azonosítja is a beszélő embert a videó felvételeken, gyakorlatilag mozgásukból, gesztusaikból és az arcukból rak össze egy mintát, amit sikeresen meg is talál később más videókon is. Képes arra is, hogy kiemelje ezeket a részeket és a »felesleget« ki is szűrje a felvételekből, felgyorsítva a későbbi részletes azonosítási folyamatokat. A szöveget le is »fordítja« érthető változatban egy szövegbe, olyan, mintha szájról olvasna.