Bigdata devine din ce în ce mai mult o provocare pentru marile corporații. Termenul "big data" este o metaforă pentru un munte de date fără valoare în care trebuie căutate cunoștințe. Big data mining descrie metodele statistice utilizate pentru a căuta tendințe, conexiuni încrucișate și informații noi. Date este căutat în datele de masă. Prelucrarea manuală a unor seturi de date atât de mari nu este posibilă, motiv pentru care trebuie utilizate metode asistate de calculator. Aceste metode pot fi utilizate și pentru cantități mai mici de date. De obicei, data mining se referă doar la etapa de analiză din cadrul procesului.
Data Mining și Big Data
Cu ajutorul mineritului de date, cantități considerabile de date pot fi examinate de programe asistate de calculator. Termenul de minerit de date este oarecum înșelător, deoarece nu se referă la generarea de date, ci la extragerea de cunoștințe din date. Termenul a devenit popular mai ales pentru că este scurt și precis. În general, mineritul de date poate fi descris ca un proces de extragere a cunoștințelor care erau necunoscute anterior și considerate potențial utile. Bigdata este utilizat pentru a descrie seturile de date care sunt prea complexe sau prea mari sau care se schimbă pur și simplu prea repede. Prin urmare, colectarea manuală sau prelucrarea prin metode clasice este exclusă. Bigdata colectate pentru a fi utilizate pentru extragerea datelor pot proveni din toate tipurile de surse. Acestea variază de la comunicarea electronică a companiilor și autorităților până la înregistrările sistemelor de supraveghere. Dorința de a analiza date de mari dimensiuni pentru a utiliza informațiile obținute intră adesea în conflict cu drepturile personale ale altor persoane, motiv pentru care este important să se protejeze aceste drepturi în prealabil.
Data Mining și Big Data: metode convenționale
În Big Data data data mining, se analizează selecții și colecții de date. Seturile de date incomplete sunt eliminate, iar sursele importante sau valorile comparative sunt adăugate. Datele sunt apoi căutate în funcție de anumite tipare comportamentale și sunt prezentate rezultatele obținute. Acestea sunt examinate și evaluate de experți, astfel încât să se poată lua o decizie cu privire la posibilitatea de a atinge obiectivul dorit. Cunoștințele dobândite sunt introduse în noi investigații sau utilizate ca parametri de comparație, astfel încât rezultatele următoarei cercetări să fie și mai precise. În timp ce, în trecut, extragerea de date în Bigdata era utilizată în principal în domeniul IT, tot mai multe companii devin interesate de metodele utilizate și de potențialul considerabil al Bigdata. În sectorul financiar, extragerea datelor este utilizată pentru detectarea fraudelor și verificarea facturilor. În cadrul scoringului de credit, Bigdata este utilizat pentru a calcula cât de mare este probabilitatea de neplată. În Marketing Data mining este utilizat pentru a calcula comportamentul de cumpărare al clienților și care sunt măsurile publicitare care îi interesează pe potențialii clienți. În magazinele online, coșurile de cumpărături sunt analizate și apoi se modifică prețurile și amplasarea produselor. În plus, se pot căuta grupuri țintă pentru campaniile publicitare și se pot examina profilurile clienților. Pe internet, extragerea de date mari este utilizată pentru a detecta atacuri, a recomanda servicii și a analiza rețelele sociale. Alte domenii de aplicare sunt, de exemplu, medicina, bibliometria și asistența medicală.
Lucruri de știut despre Bigdata și Data Mining
Bigdata sau data mining poate fi considerată o disciplină neutră la nivel științific. În cadrul mineritului de date, pot fi analizate date din toate sursele imaginabile. Cu toate acestea, de îndată ce datele se referă la o persoană, pot apărea rapid conflicte morale și juridice. De obicei, acestea nu se referă la analiza datelor, ci doar la procesul de extragere. Datele care nu au fost suficient de anonimizate pot, în anumite circumstanțe, să fie atribuite unor persoane specifice. Prin urmare, atunci când se efectuează extragerea de date mari, trebuie să se asigure întotdeauna o anonimizare care să nu permită formularea de concluzii cu privire la persoane sau grupuri de persoane. Pe lângă conflictele juridice, trebuie remarcat faptul că se ridică și probleme morale. Este discutabil dacă calculatoarele ar trebui să fie autorizate să împartă oamenii în "categorii" sau "clase". În mineritul de date, de exemplu, oamenii sunt prezentați ca fiind solvabili sau neperformanți. În general, trebuie remarcat faptul că procesul în sine este extrem de neutru din punct de vedere valoric și anonim. Procedura nu cunoaște consecințele și probabilitățile calculului. Cu toate acestea, în momentul în care oamenii sunt confruntați cu datele în viața reală, de exemplu de către Schufa, acestea pot provoca reacții de înstrăinare, jignire sau surprindere. La gigantul motoarelor de căutare Google, la Google Analytics Date privind grupurile țintă ale operatorilor de site-uri web furnizate.
Oportunități și perspective de viitor
În lumea globalizată, extragerea de date mari devine din ce în ce mai relevantă. În trecut, corporațiile americane erau în măsură să afle din comportamentul de cumpărare al clienților lor dacă erau sau nu însărcinate. Pe baza acestor informații, au fost trimise vouchere de cumpărături și sugestii de cumpărături specifice, ceea ce a dus la creșterea vânzărilor. Prin natura achizițiilor, se putea chiar prezice data nașterii, dar nu la zi. Extracția de date de tip Big Data are o mare importanță pentru întreprinderile din zilele noastre. Prin extragerea selectivă a datelor Big Data, se pot obține informații semnificative despre utilizatori și potențiali clienți. În cele din urmă, extragerea de date conduce la vânzări și profituri mai mari și, prin urmare, va deveni mult mai importantă în viitor. Nu e de mirare: în lumea globalizată și tehnologizată, colectarea de date a devenit normală și va deveni mult mai importantă în viitorul apropiat.