Természetes, hogy egyszerű beszélgetések sokféleképpen értelmezhetők. Szorongó vagy Asperger-szindrómás személyek például ezért élhetnek át extrém stresszként közösségi szituációkat. De mi történne, ha sokkal objektívebben mérnénk – és értelmeznénk – interakcióinkat?
MIT-kutatók beszélgetések hangnemét felismerő, mesterséges intelligenciával felerősített magunkon viselhető rendszert fejlesztettek. Személyes beszédmintáink és pszichológiai aktivitásunk alapján állapítja meg, hogy a társalgás boldog, szomorú vagy semleges.
A Samsung Simband viselhető egészségmérő technológiával működő prototípus fiziológiai adatokat gyűjt mozgásról, vérnyomásról, szívritmusról, bőrhőmérsékletről, az audió adatok alapján pedig az illető hangszínét, hangmagasságát, a kifejtett energiát és a szókészletet vizsgálja beszélgetés közben a rendszer.
A beszélgetés hangulatát idegháló dolgozza fel öt másodperces szakaszokban, és érzelempontokat ad hozzájuk. A kutatók 31 többperces beszélgetésen gyakoroltattak két algoritmust. Az egyik a teljes beszélgetést, a másik a szakaszokat címkézte boldognak vagy szomorúnak, illetve pozitívnak, negatívnak vagy semlegesnek.
Pontosan azonosítottak több, hangulatra utaló jelzést. Például hosszú szünetek és monoton hanghordozás szomorú, energikus szöveg és változatos beszédminták boldogabb történetekhez kapcsolódtak. A modell átlagban a véletlenszerűségnél 18, létező megoldásoknál pedig 7,5 százalékkal pontosabban címkézte az öt másodperces szakaszokat.