A Massachusetts Egyetemen (Amherst) valódi politikusbeszédekhez hasonlók írását tanuló mesterségesintelligencia-megoldást fejlesztenek. Közel 4 ezer kongresszusi beszéd, vita részleteit tartalmazó adatbázist használnak hozzá, az algoritmus azon tanul, és próbálja elkészíteni a sajátját.
A kutatók pártok és aszerint csoportosították a beszédeket, hogy a felvetett téma mellett vagy ellen foglaltak állást. Ezt követően kidolgoztak egy az n gramm valószínűségi nyelvi modellen, megközelítésen alapuló rendszert, amelyben a sorozatok n számú szavakból vagy mondatokból állnak.
A szövegeket beszédrészek szerint elemezték – minden egyes szót és kifejezést nyelvtani szerep alapján címkéztek, mielőtt az úgynevezett „6 grammot” tanulmányozták. A 6 gramm arra vonatkozik, hogy ha megadunk öt szót vagy kifejezést, milyen valószínűséggel következhet utánuk x vagy y szó, kifejezés.
Az egyik kutató, Valentin Kassarnig szerint a technikával nagyon gyorsan meghatározható az előző ötöt következő hatodik szó, akárcsak az összes lehetőség valószínűsége.
A szövegíró program speciális beszédkategóriát keresve nézi át a „6 gramm” adatbázist, és a szónoklatok elején használt teljes 5 grammos sorokat találva, véletlenszerűen kiválasztja közülük az egyiket, majd elkezdi írni a saját beszédét.