jaanuar 06 2015 0Comment
Big Data

Big Data Strateegia. Lühiülevaade läbi 7 V

Big Data strateegia!?

Tundub uurimist väärt. Big Data on Aasta Strateegia “Strategy & Business” lugejate arvates, mis selgus sellest artiklist.

Väga esmasel ja pealiskaudse uurimise alusel on tegemist statistikaga ja andmetöötlusega seotud matemaatiliste seostega ning nende seoste tulemuste põhjal otsustamisega. Seda reaalsete andmetega meie maailmas – interneti ja andmete maailmas. Kuidas seda aga strateegilises võtmes kasutada, uurin õige pea ning ülevaate ning järeldused lisan ka siia. 

Tänasel päeval on meie ümber palju digitaliseeritust ja see, mis on digitaalne, on enamasti hõlpsalt kasutatavad andmed. Andmed on iseenesest head, aga andmeid on tänapäeval tohutult palju ja meie analüüsi võime jääb alla andmete tekke kiirusele, ammugi seostest tehtavate järelduste tegemise kiirusele. Tegemist on tohutult laiapõhjaliste ja erinevat tüüpi andmetega – nagu Big Data ise ütleb: “Suurte andmetega” ja tänapäevane riist- ning tarkvara ei ole võimeline seda sellisel kiirusel analüüsima. Mahud on äärmiselt suured ja me lihtsalt ei oska küsida õigeid küsimusi, leidmas õigeid vastuseid. Siin peab appi tulema, lisaks tark- ja riistvarale, õige ja sobilik algoritm, mille abil me saame muuta andmed sisendiks otsustusprotsessi tarvis ning tänu sellele aidata organisatsioonidel kasvatada tootlikkust, efektiivsust, alandada kulusid ja kasvatada käivet. Nende andmete õige kasutamine on juba muutnud maailma ja muudab maailma veelgi, ta mõjutab ajapikku enamike majandusi ning tööstusharusid.

Mida siis tähendab “BIG DATA?” Mark Van Rijmenam’i raamatu Think Bigger autori arvates. Vaatame peamist! Üldjoontes võib “suuri andmeid” kolme “V” kaudu, samas on Mark lisanud siia veel 4 “V”-d, mis kogu dünaamikat veelgi paremini mõista aitab. Kolm “V”-d on: Velocity- tempo, kiirus; Variety- mitmekesisus, sortiment; Value- väärtus. Neli lisa “V”-d on Veracity- tõepärasus; Volume – maht; Variability- varieeruvus ja Visualization- visualiseerimine.

Big Data 7 V-d

  1. Velocity – kiirus, tempo, millega andmeid suuudetakse reaalajas luua, ladustada, analüüsida ja visualiseerida. Tegemist ei saa olla pelgalt “partiitootmisega,” kus öö jooksul andmeid analüüsitakse ja järgmisel päeval tulemusi pakutakse. See ei ole tänapäeval piisav. Vajame midagi enamat, et hallata igal minutil üles laetud Youtube videosid, Tweete Twitteris, otisnguid otsingumootorites, jne.
  2. Variety – mitmekesisus, sortiment. Tänapäeva andmed on äärmiselt mitmekesised ja väljenduvad erineval moel, nad on struktureeritud ja struktureerimata ning erinevates formaatides. Iga formaat nõuab erinevat meetodit, lähenemist ja tõlgendamist.
  3. Value – väärtus. See ei ole lihtne, sest andmed ilma analüüsita, õigete ja kasutatavate järeldusteta – teadmiseta, ei oma iseenesest väärtust. Samas järeldustel ja teadmisel võib olla väga suur väärtust, kui me räägime tõesti suurtest andmetest ja seostest tarbijate käitumises või reageeringutes. Andmetel võib olla tõeliselt suur väärtus ühiskonnale, organisatsioonidele ja tööstusharudele. Ja on selge, et iga üks soovib lõigata oma kasu.
  4. Volume – maht. Maht, mida täna käsitleme kahekordistub kahe aasta jooksul. Näiteks lennukite andurid on tootnud viimase kahe aasta jooksul 2,5 miljardit terabaiti andmeid, põllumajandusega seotud traktorite kaudu kogutakse tohutuid andmeid tegemaks paremaid otsuseid mitte ainult nende valmistamiseks ja arendamiseks, vaid ka saaduste kasvatamise osas, mis aitab farmeril teha ühe paremaid otsuseid. Andmete ladustamisega ei ole tänapäeval suuri probleeme nagu seda interneti ajastu alguses, loodud algoritmid andmete töötlemiseks ja madalamad ladustamise kulud(Hadoop tüüpi lahendused) aitavad tohutuid andmeid järjest ja järjest juurde genereerida.
  5. Veracity – tõepärasus. Samas ei ole kiirusest ja mahust kasu, kui andmed ei ole tõepärased vaid laialivalguvad. Ebakorrektsed andmed tekitavad probleeme nii organisatsioonidele kui ka tarbijatele. Ebakorrektsed andmed ajendavad meid tegema valesid otsuseid ja valed otsused viivad meid vales suunas – me kaotame aega ja raha, see on äärmiselt riskantne. Seega on äärmiselt oluline, et fookus on andmete ja analüüside kõrgetasemelisel täpsusel.
  6. Variability– varieeruvus. Andmed varieeruvad ja loomulikult on sellel oma tähendus – iga varieerumine on tingitud millestki ja statistikas saab sellest alati midagi järeldada. Samas peame me oskama varieeruvusi lugeda. Varieeruvust ei tohi segamini ajada mitmekesisusega! Kui pagar müüb erinevat tüüpi pirukaid on tegemist mitmekesisusega, kui aga sama pirukas maitseb igal korral erinevalt, on tegemist varieeruvusega.
  7. Visualization– visualiseerimine. See on “BIG DATA” raskem osa. See on tõeline väljakutse, kuidas muuta tohutult suur hulk andmeid, lihtsalt ja kiirelt loetavaks ja arusaadavaks. Andmete esitlemine ei ole tehniliselt keeruline, samas on siin võimalik arusaamist vägagi mõjutada, näidates kasvõi lihtsaid graafikuid erineval moel. Visualiseerimisel on mõju, see on kindel ja see loeb!

Big Data kokkuvõte

Tõsi – vaadeldes eelnevat võime öelda, et Big Data puhul on tegemist statistikaga. Vähemalt keskpärasele inimesele tundub kõige lähem teadus eelnevale olevat statistika ja statistiline analüüs. Ja ega see ei olegi tegelikkuses muud, arvab siinkirjutaja. Mastaabid ja tööriistad, võimalused on uued, siingi on toimunud innovatsioon! Loomulikult on see muudetud omaette strateegiaks, millega antud lähenemist paremini müüa ja teadvustada. Ja see loeb, see on “google’i” tüüpi gigantidele üks võimalik väljund ja arvestades kui personaalsed on tegelikult andmed digitaalses maailmas, siis jääb üle vaid järeldada kui ligi on meile tegelikult võimalik pääseda ka personaalsete pakkumistega. Ei ole ju uudis, et andmed annavad informatsiooni – milleks mõõtmine, SPC, Six Sigma, Statistika üldiselt? Ainuke vahe on tõeliselt SUUR mastaap! See tundub olevat ka peamine põhjus, miks seda saab tõesti nimetada “BIG DATA” strateegiaks.

andres

Write a Reply or Comment