Bigdatasta on tulossa yhä suurempi haaste suuryrityksille. Termi "big data" on metafora arvottomalle tietovuorelle, josta on tarkoitus etsiä tietoa. Big data -louhinta kuvaa tilastollisia menetelmiä, joita käytetään trendien, ristikkäisten yhteyksien ja uuden tiedon etsimiseen. Tiedot etsitään massatiedoista. Tällaisten valtavien tietokokonaisuuksien manuaalinen käsittely ei ole mahdollista, minkä vuoksi on käytettävä tietokoneavusteisia menetelmiä. Näitä menetelmiä voidaan käyttää myös pienempiin tietomääriin. Tiedonlouhinta viittaa yleensä vain prosessin analyysivaiheeseen.
Tiedonlouhinta ja Big Data
Tiedonlouhinnan avulla voidaan tutkia huomattavia tietomääriä tietokoneavusteisilla ohjelmilla. Termi tiedonlouhinta on jokseenkin harhaanjohtava, sillä siinä ei ole kyse tiedon tuottamisesta vaan tiedon poimimisesta tiedosta. Termistä on tullut suosittu lähinnä siksi, että se on lyhyt ja tarkka. Yleisesti ottaen tiedonlouhintaa voidaan kuvata prosessina, jossa uutetaan aiemmin tuntematonta ja mahdollisesti hyödylliseksi katsottua tietoa. Bigdataa käytetään kuvaamaan tietokokonaisuuksia, jotka ovat liian monimutkaisia tai suuria tai jotka yksinkertaisesti muuttuvat liian nopeasti. Manuaalinen keruu tai käsittely perinteisillä menetelmillä ei siis tule kysymykseen. Tiedonlouhinnassa käytettävä Bigdata voi olla peräisin kaikenlaisista lähteistä. Ne vaihtelevat yritysten ja viranomaisten sähköisestä viestinnästä valvontajärjestelmien tallenteisiin. Halu analysoida suurta dataa saadun tiedon hyödyntämiseksi on usein ristiriidassa muiden ihmisten henkilökohtaisten oikeuksien kanssa, minkä vuoksi on tärkeää turvata nämä oikeudet etukäteen.
Tiedonlouhinta ja Big Data: perinteiset menetelmät
Big Data -tiedonlouhinnassa analysoidaan valintoja ja tietokokoelmia. Puutteelliset tietokokonaisuudet poistetaan ja tärkeät lähteet tai vertailuarvot lisätään. Tämän jälkeen aineistosta etsitään tiettyjä käyttäytymismalleja, ja saadut tulokset esitetään. Asiantuntijat tutkivat ja arvioivat niitä, jotta voidaan päättää, voidaanko haluttu tavoite saavuttaa. Saatu tieto syötetään uusiin tutkimuksiin tai sitä käytetään vertailuparametreina, jotta seuraavan haun tulokset olisivat entistäkin tarkempia. Vaikka tiedonlouhintaa Bigdatassa käytettiin aiemmin lähinnä tietotekniikan alalla, yhä useammat yritykset ovat kiinnostuneet Bigdatan menetelmistä ja sen huomattavasta potentiaalista. Rahoitusalalla tiedonlouhintaa käytetään petosten havaitsemiseen ja laskujen tarkistamiseen. Luottopisteytyksessä Bigdataa käytetään laskemaan, kuinka suuri on maksulaiminlyönnin todennäköisyys. Vuonna Markkinointi Tiedonlouhinnan avulla voidaan laskea asiakkaiden ostokäyttäytymistä ja sitä, mistä mainostoimenpiteistä potentiaaliset asiakkaat ovat kiinnostuneita. Verkkokaupoissa ostoskorit analysoidaan, minkä jälkeen hintoja ja tuotteiden sijoittelua muutetaan. Lisäksi voidaan etsiä mainoskampanjoiden kohderyhmiä ja tarkastella asiakasprofiileja. Internetissä suurten tietojen louhintaa käytetään hyökkäysten havaitsemiseen, palvelujen suositteluun ja sosiaalisten verkostojen analysointiin. Muita sovellusalueita ovat esimerkiksi lääketiede, bibliometria ja hoitotiede.
Bigdatasta ja tiedonlouhinnasta tiedettävät asiat
Bigdata tai tiedonlouhinta voidaan katsoa tieteenalaksi, joka on neutraali tieteellisellä tasolla. Tiedonlouhinnassa voidaan analysoida tietoja kaikista mahdollisista lähteistä. Kuitenkin heti kun tiedot liittyvät henkilöön, moraalisia ja oikeudellisia ristiriitoja voi syntyä nopeasti. Nämä eivät yleensä liity tietojen analysointiin vaan ainoastaan tiedonkeruuprosessiin. Tiedot, joita ei ole riittävästi anonymisoitu, voidaan tietyissä olosuhteissa yhdistää tiettyihin henkilöihin. Kun suurten tietojen louhintaa toteutetaan, on siis aina huolehdittava siitä, että tietojen anonymisointi ei mahdollista johtopäätösten tekemistä henkilöistä tai henkilöryhmistä. Oikeudellisten ristiriitojen lisäksi on huomattava, että myös moraalisia kysymyksiä nousee esiin. On kyseenalaista, pitäisikö tietokoneille antaa lupa jakaa ihmisiä "luokkiin" tai "luokkiin". Esimerkiksi tiedonlouhinnassa ihmiset esitetään luottokelpoisina tai luottokelvottomina. Yleisesti ottaen on huomattava, että prosessi itsessään on erittäin arvoneutraali ja nimetön. Menettely ei tunne laskennan seurauksia ja todennäköisyyksiä. Kun ihmiset kuitenkin kohtaavat tiedot tosielämässä, esimerkiksi Schufan toimesta, se voi aiheuttaa vieraantuneita, loukkaantuneita tai yllättyneitä reaktioita. Hakukonejätti Google, klo Google Analytics Sivuston ylläpitäjien kohderyhmiä koskevat tiedot.
Mahdollisuudet ja tulevaisuudennäkymät
Globalisoituneessa maailmassa suurten tietojen louhinnasta on tulossa yhä tärkeämpää. Aiemmin amerikkalaiset yritykset pystyivät päättelemään asiakkaidensa ostokäyttäytymisestä, olivatko he raskaana vai eivät. Näiden tietojen perusteella lähetettiin kohdennettuja ostoseteleitä ja ostovinkkejä, jotka lisäsivät myyntiä. Hankintojen luonteen vuoksi oli jopa mahdollista ennustaa syntymäaika, vaikkakaan ei päivän tarkkuudella. Big Datan tiedonlouhinta on nykyään erittäin tärkeää yrityksille. Big Datan kohdennetun tiedonlouhinnan avulla voidaan kerätä merkittäviä tietoja käyttäjistä ja potentiaalisista asiakkaista. Tiedonlouhinta johtaa viime kädessä myynnin ja voittojen kasvuun, ja siksi sen merkitys kasvaa tulevaisuudessa huomattavasti. Ei ihme: globalisoituneessa ja teknisesti älykkäässä maailmassa tiedonkeruusta on tullut normaalia, ja se tulee olemaan paljon näkyvämpää lähitulevaisuudessa.