A Computational Paralinguistic Challenge elnevezésű megmérettetésen a feladat a beszédben rejlő információk kinyerése automatikus módszerekkel. Minden évben 20-25 nemzetközi csapat indul, idén az SZTE kutatói bizonyultak a legjobbnak – áll a közleményben.
Az Interspeech konferencia a beszédtechnológiával foglalkozók legnagyobb és legrangosabb éves konferenciája, amelyet idén Drezdában rendeztek. A szervezők minden évben versenyt is kiírnak a résztvevőknek. A Computational Paralinguistic Challenge-en a feladat a beszédben rejlő információ kinyerése automatikus módszerekkel. A korábbi években beszéd alapján kellett az alany véralkohol-szintjét megbecsülni, megsaccolni, hogy mióta fut valaki a futópadon vagy milyen ételt rág a beszéde közben. Idén többek között a Parkinson-kór felismerése volt a cél a beszélő hangja alapján.
A versenyen idén a szegedi csapat – Gosztolya Gábor és Tóth László, az MTA-SZTE Mesterséges Intelligencia Kutatócsoport tudományos munkatársa és -főmunkatársa, Grósz Tamás, az SZTE TTIK Informatikai Tanszékcsoport doktorandusz hallgatója és Busa-Fekete Róbert, a németországi Paderborni Egyetem oktatója – bizonyult a legjobbnak. A szegedi kutatók nem először vettek részt a konferencián és a versenyen, amelyről a korábbi években is szép eredményekkel tértek haza.
„A konferencia előtt egy-két hónappal egy honlapon adatbázist helyeznek el, ezen az adatbázison kell a résztvevőknek kísérletezni" – idézte a közlemény Tóth Lászlót. „A verseny lényege a gépi tanulási algoritmusok használata. Ennek során tanítópéldákat adunk az algoritmusnak, az pedig automatikusan megtalálja az összefüggéseket. A nehézséget általában a megfelelő algoritmus kiválasztása és finomhangolása jelenti. A hang felismerése ezután számítógépen keresztül szoftver segítségével történik" – tudatta a kutató.