
Beszédfelismerés és mesterséges intelligencia
A Microsoft nem ül a babérjain, a Cortana-t most portolta az iOS alapú eszközökre és már egy újabb hasonló Custom Recognition Intelligence Service (CRIS) megoldáson dolgozik.

Miközben Ön ezt olvassa, valaki máshol már kattintott erre:
Áttörés: megvan az ősz győztese, Magyar Péter selyemzsinórt kapott – itt az új Mesterterv

„Igaz ez a Siri féle megoldást akarja leginkább lemásolni, vagyis élő beszédből szeretne az azt pontosan visszaadó szöveget gyártani (speech2text). Be is mutatta az új alkalmazás 2 változatának API-ját (application programming interfaces) a fejlesztőknek. Az egyik egy hangfelismerő és azonosító algoritmus lesz, a másik az, ami az élőbeszédet írottra alakítja, ha minden igaz még ez évben béta verzió is kikerül belőlük. A fejlesztések mögött a kísérleti projekteket a redmondi cégnél végző Project Oxford stúdió áll, ez évben már egy remek mesterséges intelligenciás alkalmazással is előrukkolt (a képeken szereplő emberek érzelmi állapotát detektálta sikerrel az MI). Az API felismeri és azonosítja is a beszélő embert a videó felvételeken, gyakorlatilag mozgásukból, gesztusaikból és az arcukból rak össze egy mintát, amit sikeresen meg is talál később más videókon is. Képes arra is, hogy kiemelje ezeket a részeket és a »felesleget« ki is szűrje a felvételekből, felgyorsítva a későbbi részletes azonosítási folyamatokat. A szöveget le is »fordítja« érthető változatban egy szövegbe, olyan, mintha szájról olvasna.







