Lielo datu iespējas

27 Marts, 2018 Vjačeslavs Dombrovskis Avots: Delfi.lv

Par 4. industriālo revolūciju un par to, ka informācijas tehnoloģijas kardināli maina pasauli, kurā dzīvojām, tik runāts daudz. Notiekošā mērogu var ilustrēt ar dažiem faktiem. Piemēram, 90% no visiem esošajiem digitalizētiem datiem ir radīti pēdējo divu gadu laikā. Nākamo divu gadu laikā tiks radīti 40 zetabaiti datu – līdzinās četriem miljoniem gadu HD video ierakstu jeb piecu miljardu ASV kongresa bibliotēku krājumiem. Taču tikai 10% no visiem datiem tiek ievākti viegli analizējamā[1] formātā.

Arvien vairāk uzņēmumu izmanto tā saucamos lielos datus, lai radītu milzīgu ekonomisko vērtību. Tā, šā gada februārī Šveices farmācijas gigants Roche iegādājās tikai pirms sešiem gadiem izveidoto kompāniju Flatiron Health par 1,9 miljardiem ASV dolāru. Flatiron Health ir datu uzņēmums, kas, izmantojot partnerattiecības ar onkoloģijas klīnikām un lielākajiem medicīnas pētniecības centriem, iegūst gan strukturētus, gan nestrukturētus ar onkoloģiju saistītus datus. Izmantojot savu analītisko kapacitāti, apvienojumā ar elektroniskajiem medicīnisko ierakstu datiem, tas iegūst reālajā pieredzē balstītus secinājumus un rekomendācijas. Pirms desmit gadiem četras vērtīgākas kompānijas pasaulē bija Exxon Mobil, Petrochina, General Electric un Gazprom. Šodien, tas ir Apple, Alphabet (Google), Microsoft un Amazon.

Var rasties jautājums – nu un? Lielajā pasaulē top jauni tehnoloģiskie brīnumi un pēc kāda laika mēs gan jau ka sagaidīsim, ka no lielajiem datiem radītie jauni produkti un pakalpojumi tiks piedāvātas iegādei arī Latvijā. Taču mēs uzskatām, ka pie zināmiem nosacījumiem un pietiekams uzņēmības arī Latvija var būt nevis pasīvs novērotājs, bet jaunās ēras dalībnieks un arī pelnītājs. Kā to izdarīt?

Lielo datu biznesa modeli veido četri elementi, tā saucamie četri A: datu vākšana (Acquisition), apkopošana un uzglabāšana (Aggregation), analīze (Analysis) un pielietojums (Application). Pirmais uzdevums ir saprast kurā nišā jābūvē sava salīdzinošā priekšrocība.

Datu vākšana

Sensoru tehnoloģijas attīstās arvien vairāk un kļūst pieejamākas, paverot milzīgas iespējas datu vākšanai. Bet sensoru izmantošanai ir jēga tad, ja savāktos datus var efektīvi un operatīvi apkopot un pārraidīt. Tā, pirmās valstis kurās tiks izveidoti 5G tīkli, būs ieguvējas no tā saucamā lietu interneta (Internet-of-Things (OoT)) ekspansijas. Tiek lēsts, ka 2020. gadā cilvēki izmantos apmēram 20,4 miljardus lietu interneta (IoT) iekārtu un tas ievērojami palielinās analīzei pieejamo reāllaika datu apjomu.

Viens no lielākajiem izaicinājumiem šajā procesā ir personīgo datu konfidencialitāte. Lielo datu straujais pieaugums ir izraisījis bažas par pilsoņu privātumu un personīgo datu ļaunprātīgu izmantošanu, ko varētu īstenot Orvela “lielā brāļa” stila valdības vai alkatīgi uzņēmēji. Ir svarīgi atrast līdzsvaru starp personas datu aizsardzību un privātumu no vienas puses, un uzticamu vidi, kas veicinātu ekonomiskās vērtības radīšanu, no otrās. Šajā jautājumā valstis izvēlas dažādus ceļus. Piemēram, Vācijā ir ļoti stingra nostāja attiecībā uz konfidencialitāti, ierobežojot datu apmaiņu un analīzi. Tas ir kavējis Vācijas uzņēmumu, piemēram, Siemens, Daimler u.c. iespējas ieviest jaunus, uz datiem balstītus uzņēmējdarbības modeļus.

Datu apkopošana un uzglabāšana

Sensoru tehnoloģijas, 5G datu pārraide, lietu internets, arvien lielāki lielo datu apjomi – tas viss nozīmē, ka aizvien vairāk datu tiks saglabāts “mākoņos”, starp kuriem dominē Microsoft, Amazon un Google krātuves. Cisco prognozē, ka lielie dati turpinās veicināt uzglabājamo datu kopējo pieaugumu un 2021. gadā šis apjoms sasniegs 403 EB, veidojot 30% no visos datu centros uzglabājamo datu apjoma.[2]

Analīze

Pašiem pa sevi datiem nav vērtības, to var piešķirt vien ar datu analīzi sasniedzams mērķis. Šīs mērķis ir mākslīgā intelekta (Artificial Intelligence (AI)) – algoritmu kopuma, kas ļautu automatizēt tā dēvētos kognitīvos uzdevumus – izveide.

Pēdējā laikā mākslīgā intelekta izveidē ir gūti lieli panākumi. Piemēram, jau ilgstoši AI izstrādātāju izaicinājums bija iemācīt datoram spēlēt seno ķīniešu galda spēli Go. Tā ir sarežģīta spēle, kurā iespējamais spēles kauliņu konfigurāciju skaits ir lielāks nekā atomu skaits Visumā. Korporācijas Google uzņēmuma DeepMind komandas izstrādātais AlphaGo algoritms sākotnēji trenējās ar tūkstošiem šīs spēlēs spēlētājiem, gan amatieriem, gan profesionāļiem, līdz 2016. gadā pārspēja Lī Sedolu (Lee Sedol), tā brīža Go čempionu. Savukārt jaunais modelis, kas tika izveidots 2017.gadā ar nosaukumu AlphaGo Zero, šo apmācību solis izlaida, mašīna mācījās spēlēt, spēlējot pati pret sevi.[3] Iesākumā mašīna zināja tikai spēles pamata noteikumus, tai nebija nekādu iepriekšēju zināšanu par spēli. Pēc trīs stundām tā spēlēja kā cilvēks – iesācējs. Pēc trīs dienām tā pārspēja savu agrāko versiju – AlphaGo. Bet pēc 21 dienas tā sasniedza līmeni kad spēja uzveikt 60 labākos pasaules profesionāļus, ieskaitot 2017. gada čempionu trijās spēlēs no trim

Un tomēr, neskatoties uz milzīgiem panākumiem precīzi definētu uzdevumu izpildē, zinātnieki ir ļoti tālu no īsta mākslīgā intelekta. AI attīstības panākumu pamatā, sākot no runas atpazīšanas līdz autonomām automašīnām un veselības aprūpei, ir tieši lielo datu izmantošana. Tam pamatā ir tā saucamā dziļās mācīšanās (deep learning) tehnoloģija. Tā ir metode, kas ļauj robotiem mācīties un vispārināt savas asociācijas, balstoties uz ļoti lieliem (bieži vien “mākonī” balstītiem) “mācību komplektiem”, kas parasti aptver miljoniem piemēru. Saistīta joma ir mākoņrobotikas koncepts. Tajā katrs robots mācās no visu robotu pieredzes, kā rezultātā notiek robotu kompetences strauja izaugsme, jo īpaši, pieaugot robotu skaitam.[4]

Kas no tā visa var sanākt?

Ļoti daudz kas, sākot ar autonomām mašīnām, un beidzot ar tā saucamām viedām pilsētām. Arvien vairāk ekspertu uzskata, ka veselības aprūpes jomā revolūcija notiks, ienākot apritē jauniem datu uzkrāšanas, apstrādes un izmantošanas veidiem.[5] Tā, IBM nesen izveidoja vienotu komandu ar ASV onkoloģijas centra Memorial Sloan-Kettering Cancer Center ārstiem, lai mācītu datoru Vatsonu (Watson) nodrošināt pastāvīgu pacientu aprūpi un noteikt vēža ārstēšanas plānu. Lai to paveiktu, topošajam veselības aprūpes mākslīgajam intelektam ir jāiemāca kā analizēt milzīgu, parasti nestrukturētu informācijas daudzumu. Mācīšanas procesā salīdzinošai novērtēšanai un modeļa atpazīšanai tiek izmantoti dati no 600 000 medicīnisku faktu aprakstiem, 1,5 miljoni pacientu ierakstiem un klīniskajiem pētījumiem, kā arī divi miljoni lappušu teksta no medicīnas žurnāliem. Un jo vairāk dators mijiedarbojas ar reālām situācijām, jo ātrāk tas var iemācīties un uzlabot sniegumu, nosakot medicīniskās problēmas un to ārstēšanas veidus.

Kādi praktiski secinājumi Latvijai?

Protams, jābūt reālistiem. Pie minētajiem izaicinājumiem strādā pasaules vērtīgākie uzņēmumi, kuri spēj piesaistīt vislabāko zinātnisko cilvēkkapitālu. Piemēram, tikai Google strādā gandrīz 74 000 augstākas raudzes speciālistu. Salīdzinājumam, Latvijā ik gadu paradās vien daži simti absolventi ar izglītību IT jomā. Kā un ar ko Latvija varētu ieinteresēt kādu no pasaules gigantiem lielo datu jomā?

Mūsuprāt, atbilde ir acīmredzama. Sākotnējais piedāvājums jāveido tieši lielo datu vākšanas jomā. Izmantojot šo piedāvājumu, jāpārliecina starptautiskas kompānijas izmantot Latvijas cilvēkkapitālu arī darbam pie iegūto lielo datu analīzes, un pieslēgt uzņēmīgus prātus arī pie mēģinājumiem radīt jaunu pielietojumu lielajiem datiem.

 

[1] Pasaules ekonomikas forums, 2017

[2] Cisco. 2018. Cisco Global Cloud Index: Forecast and Methodology, 2016-2021 White Paper. https://www.cisco.com/c/en/us/solutions/collateral/service-provider/global-cloud-index-gci/white-paper-c11-738085.html#_Toc503317524

[3] Hassabis, D. and Silver, D. 2017. AlphaGo Zero: Learning from scratch. https://deepmind.com/blog/alphago-zero-learning-scratch/

[4] Pratt, G. A. 2015. Is a Cambrian Explosion Coming for Robotics? Journal of Economic Perspectives, 29 (3), 51-60.

[5] Cohn, J. 2013. The Robot Will See You Now. The Atlantic, March Issue. https://www.theatlantic.com/magazine/archive/2013/03/the-robot-will-see-you-now/309216/