Az IBM Watsonja nem pihen, most nyelvi képességeit pallérozza: hírügynökségi jelentésekből generál összefoglalókat.
A 2011-ben Jeopardy bajnokokat legyőző Watson az utóbbi évek és a jelen egyik legizgalmasabb, legígéretesebb mesterségesintelligencia-fejlesztése.
A kutatók most dokumentumok lényegét naprakész módszerekkel kiemelő rendszert alkotnak a híres IBM-platformból. Mélytanulás-módszerekkel próbálják pallérozni Watson kérdéseket megválaszoló algoritmusát. Az algoritmus többmillió angol nyelvű hírügynökségi jelentés alapján készített rövid összefoglalókat.
„A szöveg összefoglalására fókuszálunk, ami bemenet-kimenet viszonylatban lényegében szavakból álló célszakasz kialakítása a forrásdokumentum szavainak bemenő szakaszából. Ezt a célszakaszt hívják összefoglalónak ” – írják a kutatók.
A mélytanulás-alapú „szakasztól szakaszig” megközelítést a gépi fordításban használják leggyakrabban.
Egy szöveg kivonatolása jelentősen különbözik az összefoglalótól. Az összefoglaló általában rövid, hosszúsága nem függ a dokumentum hosszától, és elfogadott, hogy az alapgondolat kivételével mindent kihagyunk belőle.
A kutatók hangsúlyozzák, hogy ideghálójuk jobb teljesítményt nyújt, mint a Facebook által ugyanerre a célra használt friss csúcsmodell.
„Az általuk készített szövegek meglepően jók, a legtöbbről simán elhihető, hogy ember írta” – állítják a kutatók.
Összefoglalók készítése mindenképpen fontos, ha valóban az a cél, hogy a számítógépek ugyanolyan jól értsék a nyelvet, mint mi magunk.