Gépi tanulási modell küszöbölheti ki az elfogultságot

2021. április 06. 16:08

Elgondolkodtató, hogy a közösségi oldalak, mint például a Facebook és a LinkedIn miként adnak ajánlásokat azokra az emberekre, akiket esetleg ismerhetünk.

2021. április 06. 16:08
null

A színfalak mögött olyan gépi tanulási módszerek találhatóak, melyek a megadott adatokat elemzik. Ilyenek információk lehetnek például: végzettség, elhelyezkedés vagy politikai hovatartozás. Majd ezeket felhasználva hasonló embereket és oldalakat kínálnak fel a felhasználók számára. Azonban van egy olyan összetevője is az adatelemzésnek, amely miatt érzékenyebb lesz a rendszer, ez pedig a GNN néven ismert mutató, ami alapján bőrszín vagy nem szerint is meg tudja különböztetni a felhasználókat a gép, ebből adódóan pedig relevánsabb ajánlásokat kínálhat. 

Mivel azonban a felhasználók többsége vonakodik attól, hogy ilyen személyes adatokat nyilvánosságra hozzon, ezért a Penn State Informatikai és Technológiai Főiskola kutatói egy olyan újszerű módszert dolgoztak ki, amely becsléseket végez ezekről az érzékenyebb adatokról, ezzel segítve a GNN mutatónak a korrektebb ajánlások megtételét.

A kutatócsoport megállapította, hogy a FairGNN nevű modelljük rendkívül jól teljesít a próbák során. Rájöttek, hogy az emberek főként azokkal a társaikkal veszik fel a kapcsolatot, akik velük azonos régióban élnek, vagy hasonló életkorúak. 

A modell két valós adatkészlettel lett kiképezve: az egyiket a népszerű szlovák közösségi oldalról, a Pokecről gyűjtötték, a másikat pedig körülbelül 400 NBA kosárlabdázó adataiból. A Pokec adatkészletében azt a régiót kezelték érzékeny tulajdonságként, ahonnan az egyes felhasználók származtak, és a rendszernek a felhasználók munkaterületét kellett megjósolnia, az NBA játékosok esetében pedig szintén a helyszínt használták annak az előrejelzésére, hogy az egyes játékosok fizetése meghaladja-e a mediánt.

Mivel az eredeti adatok a rendelkezésükre álltak, így pontosan meg tudták mondani, hogy a módszer mennyire pontos, és mint kiderült, rendkívül hatékonyan és igazságosan dolgozott a rendszer. Ez pedig más területeken is hasznos lehet, például álláskeresők rangsorolásánál, bűncselekmények felderítésénél, esetleg pénzügyi kölcsönök intézésénél. Ezek mind olyan területek, ahol nem szabad elfogultnak lenni, így kulcsfontosságú, hogy pontos és tisztességes javaslatokat tegyen a gép.

A kutatócsoport a virtuális ACM Internetes Keresési És Adatbányászati Konferencián mutatta be munkáját, és amennyiben elfogadják a terveket, úgy valószínűleg nemsokára be is vezetik a módszert a valóságban is.

A cikk szerzője Blősz Dalma
 

Összesen 4 komment

A kommentek nem szerkesztett tartalmak, tartalmuk a szerzőjük álláspontját tükrözi. Mielőtt hozzászólna, kérjük, olvassa el a kommentszabályzatot.
Sorrend:
Naten
2021. április 07. 23:26
"Rájöttek, hogy az emberek főként azokkal a társaikkal veszik fel a kapcsolatot, akik velük azonos régióban élnek, vagy hasonló életkorúak." Azta, soha se gondoltam volna... (britt tudósok megállapították...)
Jelenleg csak a hozzászólások egy kis részét látja. Hozzászóláshoz és a további kommentek megtekintéséhez lépjen be, vagy regisztráljon!