Data Mining og Big Data for Business

Bigdata bliver i stigende grad en udfordring for store virksomheder. Udtrykket "big data" er en metafor for et værdiløst bjerg af data, som man skal søge viden i. Big data mining beskriver statistiske metoder, der anvendes til at søge efter tendenser, krydsforbindelser og nye oplysninger. Data søges efter i massedata. Manuel behandling af så store datasæt er ikke mulig, og derfor må der anvendes computerassisterede metoder. Disse metoder kan også anvendes til mindre datamængder. Data mining henviser normalt kun til analysetrinnet i processen.

Datamining og Big Data

Med data mining kan store datamængder undersøges ved hjælp af computerstøttede programmer. Udtrykket data mining er lidt misvisende, da det ikke drejer sig om at generere data, men om at udvinde viden fra data. Udtrykket er blevet populært, især fordi det er kort og præcist. Generelt kan data mining beskrives som en proces, hvor man udvinder viden, der tidligere var ukendt og blev anset for at være potentielt nyttig. Bigdata bruges til at beskrive datasæt, der er for komplekse eller store, eller som simpelthen ændrer sig for hurtigt. Manuel indsamling eller behandling med klassiske metoder er derfor udelukket. De indsamlede Bigdata, der skal bruges til datamining, kan komme fra alle mulige kilder. De spænder fra elektronisk kommunikation mellem virksomheder og myndigheder til optegnelser fra overvågningssystemer. Ønsket om at analysere big data med henblik på at udnytte den opnåede indsigt kommer ofte i konflikt med andre menneskers personlige rettigheder, og derfor er det vigtigt at sikre disse rettigheder på forhånd.

Data Mining og Big Data: konventionelle metoder

I Big Data data mining analyseres udvælgelser og datasamlinger. Ufuldstændige datasæt fjernes, og vigtige kilder eller sammenligningsværdier tilføjes. Derefter søges der i dataene efter specifikke adfærdsmønstre, og de opnåede resultater præsenteres. Disse undersøges og vurderes af eksperter, så der kan træffes en beslutning om, hvorvidt det ønskede mål kan nås. Den viden, der opnås, indgår i nye undersøgelser eller bruges som sammenligningsparametre, så resultaterne af den næste søgning bliver endnu mere præcise. Mens data mining i Bigdata tidligere primært blev brugt inden for IT, er flere og flere virksomheder begyndt at interessere sig for de anvendte metoder og det store potentiale i Bigdata. I den finansielle sektor bruges data mining til at opdage svindel og verificere fakturaer. I kreditvurdering anvendes Bigdata til at beregne, hvor stor sandsynligheden for misligholdelse er. I den Markedsføring Data mining bruges til at beregne kundernes købsadfærd og til at finde ud af, hvilke reklameforanstaltninger potentielle kunder er interesserede i. I onlinebutikker analyseres indkøbskurvene, og derefter ændres priserne og placeringen af produkterne. Desuden kan der søges efter målgrupper for reklamekampagner og undersøges kundeprofiler. På internettet bruges big data mining til at opdage angreb, anbefale tjenester og analysere sociale netværk. Andre anvendelsesområder er f.eks. medicin, bibliometri og sygepleje.

Ting, du skal vide om Bigdata og datamining

Bigdata eller data mining kan betragtes som en disciplin, der er neutral på et videnskabeligt niveau. Ved data mining kan data fra alle tænkelige kilder analyseres. Men så snart dataene vedrører en person, kan der hurtigt opstå moralske og juridiske konflikter. Disse vedrører normalt ikke analysen af dataene, men kun udtrækningsprocessen. Oplysninger, der ikke er tilstrækkeligt anonymiseret, kan under visse omstændigheder henføres til bestemte personer. Når der foretages data mining af big data, skal man derfor altid sørge for at sikre anonymisering, så der ikke kan drages konklusioner om personer eller grupper af personer. Ud over de juridiske konflikter bør det bemærkes, at der også rejses moralske spørgsmål. Det er tvivlsomt, om computere skal have tilladelse til at opdele mennesker i "kategorier" eller "klasser". I data mining præsenteres personer f.eks. som kreditværdige eller ikke-kreditværdige. Generelt skal det bemærkes, at selve processen er yderst værdineutral og anonym. Proceduren kender ikke konsekvenserne og sandsynlighederne af beregningen. Men så snart folk bliver konfronteret med dataene i det virkelige liv, f.eks. af Schufa, kan det medføre fremmedgjorte, fornærmede eller overraskede reaktioner. Hos søgemaskinegiganten Google, på Google Analytics Oplysninger om webstedsoperatørernes målgrupper.

Muligheder og fremtidsudsigter

I den globaliserede verden bliver data mining af store data mere og mere relevant. Tidligere kunne amerikanske virksomheder ud fra deres kunders købsadfærd se, om de var gravide eller ej. På baggrund af disse indsigter blev der sendt målrettede indkøbskuponer og tips til shopping ud, hvilket øgede salget. På grund af købets art var det endda muligt at forudsige fødselsdatoen, om end ikke på dagen nøjagtigt. Data mining af Big Data er af stor betydning for virksomheder i dag. Ved hjælp af målrettet datamining af Big Data kan der indsamles vigtig viden om brugere og potentielle kunder. Data mining fører i sidste ende til større salg og overskud og vil derfor blive meget vigtigere i fremtiden. Det er ikke så underligt: I den globaliserede og teknologiske verden er dataindsamling blevet normal, og den vil blive langt mere fremtrædende i den nærmeste fremtid.

 

Aktuelle artikler