Számos projekt már most is használ szintetikus tartalmakat, amelyeket gyakran olyan adatgeneráló szolgáltatásoktól szereznek be, mint a Mostly AI. A The Conversation szerint ez a módszer a jövőben egyre elterjedtebbé válhat.
A fejlesztők az ingyenes online téren kívül is keresnek tartalmakat, például a nagy kiadók és más szolgáltatók külső tárhelyein lévőket. Gondoljunk csak az internet előtt megjelentetett szövegek millióira, amelyek digitálisan elérhetővé téve új adatforrást jelenthetnek a mesterségesintelligencia-projektekhez.
A tartalomkészítők tiltakoztak az ellen, hogy a tartalmaikat jogtalanul használják fel mesterségesintelligencia-modellek képzésére, sőt néhányan be is perelték őket. Azonban van remény, mivel a világ egyik legnagyobb híroldal-tulajdonosa, a News Corp nemrégiben közölte, hogy tartalmi megállapodásokról tárgyal MI-fejlesztőkkel. Ezek értelmében az MI-vállalatoknak fizetniük kell a képzési adatokért.
De nem ez a cég az egyetlen. A Financial Times (FT) megállapodást kötött az OpenAI-jal, így a mesterségesintelligencia-modelljeit többek között az említett hírportál archivált cikkein taníthatja be. A megállapodás értelmében az FT licenceli az anyagait a ChatGPT-t feltaláló vállalatnak, hogy segítsen továbbfejleszteni a már eddig is nagy sikerű termékeit.
A neves MI-startuppal az amerikai Associated Press, a német Axel Springer, a francia Le Monde és a spanyol Prisa Media is kötött megállapodást.