Mi volt a célja Kiss Balázsnak a magyar Tumblr-esek híres-hírhedt kapcsolati hálójának megalkotásával? Milyen módszerrel alkotta meg azt? Jogosnak érzi-e a kritikákat, és mit csinálna másképp? Többek között ezekre a kérdésekre is választ adott a Tumblr kapcsolati hálójának adatvizualizációját megalkotó 25 éves salgótarjáni, de két és fél éve Budapesten dolgozó informatikus srác.
Hogy jött az ötlet, hogy elkészítsd a magyar Tumblr kapcsolati hálóját?
Körülbelül fél éve merült fel az ötlet egy barátommal való beszélgetés során, hogy a közösségi oldalakon lévő információkat lehet gráfokban is tárolni-ábrázolni. Eleinte a facebookos ismerőseim, és az általuk lájkolt oldalak letöltéséhez írtam egy scriptet, majd a kapott adatokat egy Gephi nevű nyílt forráskódú programmal elemeztem és ábrázoltam. Azóta többféle közösségi oldallal is próbálkoztam, mind közül a Tumblr biztosítja a legjobb hozzáférést az egyes blogok publikus adataihoz.
Felmerült többek részéről, hogy miért látszanak kevésbé népszerű tumbászok az ábrádon úgy, mintha „központi Tumblr-esek” lennének, míg más, ismertebb mikrobloggerek sokkal kisebb körként jelentek meg. Milyen módszertannal dolgoztál?
Az adatok letöltése úgy működik, hogy a program megnézi az én legutóbbi 180 posztomat, és egy adatbázisban tárolja, hogy kiktől reblogoltam azokat. Utána ugyanígy megnézi az adatbázisba bekerült emberek blogjait, majd az ő blogjaikról begyűjtött adatokat is. Az egész hármas mélységig fut le, tisztítás-szűrés előtt kb. 30 ezer blog és 40 ezer kapcsolat került az adatbázisba. Ebből az adatbázisból kitakarítottam a „levél-elemeket”, akiknek csak egy kapcsolata volt, utána pedig egy clusterező (csoportokat felismerő) algoritmus szétbontotta tovább a megmaradt blogokat, és ezek közül volt az egyik a magyar tumbászoké.
Az egyes blogok elhelyezéséhez egy beépített algoritmust használtam, ez rugószerűen húzza össze és tolja szét az egyes blogokat az ábrán. Akiknek sok a közös „rugójuk”, azok közel kerülnek egymáshoz, akiknek nincs sok köze egymáshoz, azok pedig távolabb helyezkednek el.
Többen kifogásolták azt is, hogy külföldi blogok is rákerültek az ábrára.
Igen, ezek pont amiatt kerültek be, mert annyian reblogoltak tőlük, hogy az algoritmus a közösség részének értelmezte ezeket is. Az elsődleges célom az volt ezzel az ábrával, hogy az információ terjedését (reblogolásokat) ábrázolni tudjam a magyar tumbászok hálózatában.
Azokat a kritikákat, hogy a körök mérete nem adja vissza teljesen az egyes blogok fontosságát, jogosnak tartom. Ha újra leszedném az adatokat, akkor valószínűleg figyelném már azt is, hogy mennyi eredeti tartalmat posztol az adott blog írója, és ez alapján súlyoznám az eredményeket.
Mennyi ideig tartott ezt a hálót megalkotni?
Az egész folyamat nagyjából egy hetet vett igénybe, sokszor futtattam le a feltérképező scriptet különböző paraméterekkel, amíg egy relatíve elfogadható eredmény nem született. Amint megvoltak a nyers adatok, már pofonegyszerű volt rendezni és értelmezni őket.
Kaptál-e közvetlenül visszajelzéseket, vagy figyelted-e a Tumblr-t, hogy ott milyen reakciókat váltott ki az ábrád?
Visszajelzést csak annyit kaptam napközben, hogy öcsém szólt, hogy kikerült az ábra a SocialTimes.hu-ra. Majd este amikor hazaértem, akkor pörgettem végig a Tumblr dashboardját, s láttam, hogy a kapcsolati hálós ábrám különféle photoshoppolt paródiái köszönnek vissza. A kedvencem az oroszlánkirályos közülük.
Ezek szerint te magad is használod a Tumblr-t?
Igen, magam is fenn vagyok 2011 óta Tumblr-en, általában random szöveges posztok és némi saját tartalom (pl. absztrakt hálózatok ábrái) mellett más általam követett blogok tartalmait szoktam reblogolni.