A Georgia Tech kutatói twitteres bejegyzések hitelességvizsgálatára használható nyelvi modellt dolgoztak ki. A modell szavakat, kifejezéseket azonosít, amelyekkel aztán megállapítható, mennyire tűnik hihetőnek egy-egy tartalom.
A kutatók kb. 1400 világeseményhez kapcsolódó 66 millió tweetet vizsgálva állapították meg, hogy sokmillió ember közösségi médiában használt szavai rengeteget elárulnak az esemény hitelességéről. 2014-es és 2015-ös eseményekre összpontosítottak, köztük az Ebola nyugat-afrikai feltűnésére, a Charlie Hebdo elleni terrorakcióra és Eric Garner halálára New York Cityben.
Megkértek személyeket, hogy hitelességük alapján ítéljék meg a posztokat (biztos pontos, biztos nem pontos), majd a szavakat 15 nyelvi kategóriába rendező modellbe tették. Mindegyik tartalmazott pozitív és negatív érzéseket, szorongást, hírverést stb. Ezt követően nézték át a szavakat, hogy megállapítsák, hiteles vagy sem az adott tweet. Eredményeik 68 százalékban megegyeztek az emberi véleménnyel.
„Más jelekkel, például az esemény topikjával vagy szerkesztett információkkal összekombinálva, nyelvi eredményeink egy automatizált rendszer fontos alapjai lehetnek” – nyilatkozta Eric Gilbert professzor, a projektet vezető Tanushree Mitra egyik tanácsadója.