A big data árnyoldala az adatvagyon melletti adatszemét. Maciej Cegłowski lengyel-amerikai webfejlesztő és üzletember, az online könyvjelző-szolgáltatás Pinboard tulajdonosa a radioaktív hulladékhoz hasonlítja az adathalmazokat – szivárgás esetén ugyanolyan masszív és veszélyes. A hype és a remények szintén a radioaktivitás körül száz éve kialakult őrületet, radioaktív címkével eladott cigarettát, alsóneműt és hasonló termékeket idéznek.
Cegłowski példája szélsőséges, az ipari melléktermék párhuzam helyénvalóbb. Minden tevékenységgel adat generálódik, korlátlan mennyiségben előállítható erőforrás, egyesek értékesek, zömük viszont értéktelen és potenciálisan veszélyes. Olcsó tárolásuk, egyszerű törlésük miatt viszont folyamatos a kísértés, hogy mindet megtartsuk, hátha egyszer találunk bennük valamit. Pedig a többségüktől jobb lenne szabadulni, mert hiába ártatlan és hasznavehetetlen egyetlen információdarabka, más darabkákkal kirakosgatva személyes adatok sokasága kerülhet illetéktelen kezekbe.
Fehér Könyv
Az adatvagyon egyre nő, a magánszektort követően egyes államok, globális és regionális szervezetek, multinacionális nagyvállalatok is okos adatpolitikával használják és hasznosítják újra a benne lévő lehetőségeket, növelik vele versenyképességüket, miközben szaporodnak a nyíltadat-portálok. Magyarországon viszont úgy tűnt, parlagon marad az egész, kb. tíz éves a lemaradás, átültettük ugyan a kapcsolódó uniós irányelvet, nagyjából ennyi történt, a döntéshozóknak sok fogalmuk nincs az egészről, napról napra nő a versenyhátrány. A kósza kezdeményezések hamvukba holtak, és a nemzeti adatvagyon (főként a központi nyilvántartásokban található adatok) lényegét azok is csak kapirgálták. Elvileg ebbe az adatvagyonba kellene tartozniuk a tér-, meteorológiai adatoknak, audiovizuális gyűjteményeknek stb. is.