Tehnoloogia
areng on muutnud võimalikuks ülisuurte andmemahtude kogumise, hoiustamise ja
kasutamise. Big data on üks kiiremini kasvavaid IT segmente – uusi startup’e,
mis pakuvad tehnoloogiaid struktureerituid ja struktureerimata andmete
kogumiseks, haldamiseks ja analüüsimiseks, tekib nagu seeni pärast vihma. See
on valdkond, mis tekitab kahetisi tundeid. Ühtpidi on hirmuäratav, et kuskil
pilves on miskit, mis teab sinust rohkem kui sa isegi. Teisalt räägivad selle
pooldajad, et rohkem andmeid tähendab ka täpsemaid andmemudeleid ning paremini
toimivaid algoritme. Need omakorda aitavad muuta otsustusprotsessid
efektiivsemaks, vähendades otsustes sisalduvat subjektiivsust ja viies nõnda
suurema õigluseni. Vähemalt teoorias peaks see nii olema…
Cathy
O’Neill on aga teist meelt. Raamatus „Weapons of Math Destruction“ väidab ta,
et matemaatilised mudelid ning infotehnoloogilised edusammud, mis on andnud
võimaluse asendada inimeste erapoolikud ning mitteobjektiivsed otsused
automatiseeritud ja mudelitel põhinevate otsustusprotsessidega, ei paranda
tehtud otsuste kvaliteeti, vaid viivad hoopis suurema ebaõigluse ning
diskrimineerimiseni. Tema arvamus põhineb näidetel, mis hõlmavad eri valdkondi,
ulatudes näiteks algoritmidest, mida kasutatakse finantssektoris laenutaotluste
läbivaatamiseks ja kindlustusmaksete määramiseks, kuni algoritmideni, mida
kasutatakse õpetajate hindamise ning töötaotlejatele „jah“ või „ei“ sõna
ütlemiseni. O’Neill ei taha öelda, et kõik algoritmid on halvad – seda
kindlasti mitte. Big data mudelitel, mis on n-ö kahjustavad ja millele ta oma
raamatus keskendub, on kolm tunnust: läbipaistmatus, toimimine suures ulatuses
ning kahju tekkimine. Teisisõnu on need justkui suur must karp. Seejuures seda,
mis seal karbi sees on, teavad vaid matemaatikud ja koodikirjutajad. Samas mõjutavad
nad suurt hulka inimesed. See tähendab, et süsteemsed vead nendes võivad rikkuda
elusid.
Kahtlemata
paneb see raamat mõtlema. Tekib näiteks küsimus, kas see, kui anname
otsustusprotsessis juhtiva rolli üle arvutitele, mis kasutavaid vaid mineviku
andmeid, tekitab tõepoolest iseenesest olukorra, kus minevik kordub? Ilustamata
ja lihtsustades öeldes: rikkad jäävad Big data mudelite toel rikkaks ning
vaesed vaeseks? Kas katse elimineerida algoritmide abil otsustes subjektiivsust,
ei või viia tõsisemate tagajärgedeni, kui kõhutundel ja eksperthinnangul tehtud
üks vale otsus? Jah, küsimusi tekib palju. Kindlat seisukohta ega vastust minul
siin ei ole. Ütlen ausalt, et ka minus tekitavad mudelid, mis näiteks
krediidireitingute määramisel tuginevad Facebookist kättesaadaval infol, pisut
skeptilisust. Ja skeptitsismi
aluseks on just arusaamatus. Ma ei ole kindel, et kõik on modelleeritav ja
allub teatud seaduspärasustele. Veel enam, usun ja arvan, et muutes midagi
automaatseks kaob ka vastutus. Põhjendus, et mudel ütles nii, ei pruugi olla otsuste
vastu võtmiseks piisav. Nagu O’Neill oma raamatus väga selgelt välja toob, ka
mudelid eksivad ja neil eksimustel võib olla kõrge hind.
Kokkuvõttes
on tegemist raamatuga, mis paneb mõtlema big dataga seotud ohtude üle. Olgugi
et big data revolutsioonile ei maksa kätt ette panna, väärivad selle võimalikud
negatiivsed mõjud läbimõtlemist, analüüsimist ja kajastamist. Üksnes nõnda on
võimalik kitsaskohtadele reageerida ja ühiskonna heaolu suurendada.