I bigdata stanno diventando sempre più una sfida per le grandi aziende. Il termine "Big Data" è la metafora di una montagna di dati senza valore in cui si deve cercare la conoscenza. Bigdata mining descrive i metodi statistici utilizzati per cercare tendenze, connessioni incrociate e nuovi dati. Dati viene ricercato nei dati di massa. L'elaborazione manuale di questi enormi insiemi di dati non è possibile, ed è per questo che si devono usare metodi assistiti dal computer. Questi metodi possono essere utilizzati anche per quantità più piccole di dati. Il data mining di solito si riferisce solo alla fase di analisi all'interno del processo.
Data Mining e Big Data
Con il data mining è possibile esaminare una notevole quantità di dati con l'ausilio di programmi informatici. Il termine data mining è in qualche modo fuorviante, poiché non si tratta di generare dati, ma di estrarre conoscenza dai dati. Il termine è diventato popolare soprattutto perché è breve e preciso. In generale, il data mining può essere descritto come un processo in cui si estrae una conoscenza precedentemente sconosciuta e considerata potenzialmente utile. I bigdata vengono utilizzati per descrivere quantità di dati troppo complesse o troppo grandi o che semplicemente cambiano troppo rapidamente. L'inserimento manuale o l'elaborazione con metodi classici è quindi impossibile. I bigdata raccolti da utilizzare per il data mining possono provenire da tutte le possibili fonti. Si va dalle comunicazioni elettroniche di aziende e autorità alle registrazioni dei sistemi di monitoraggio. Il desiderio di analizzare i bigdata per utilizzare le conoscenze acquisite spesso entra in conflitto con i diritti personali di altre persone, per questo motivo è consigliabile proteggersi in anticipo.
Data Mining e Big Data: metodi convenzionali
Il data mining di Big Data comporta l'analisi di selezioni e raccolte di dati. I set di dati incompleti vengono rimossi e vengono aggiunte fonti importanti o valori di confronto. I dati vengono poi ricercati per modelli comportamentali specifici e vengono presentati i risultati ottenuti. Questi vengono esaminati e valutati da esperti in modo che si possa decidere se l'obiettivo desiderato può essere raggiunto. La conoscenza acquisita viene alimentata in nuove indagini o utilizzata come parametri di confronto in modo che i risultati della ricerca successiva siano ancora più accurati. Mentre il data mining nei Bigdata è stato utilizzato principalmente nell'IT in tempi precedenti, sempre più aziende si stanno interessando ai metodi utilizzati e al notevole potenziale dei Bigdata. Nel settore finanziario, il data mining è utilizzato per il rilevamento delle frodi e la verifica delle fatture. Nel credit scoring, i Bigdata sono usati per calcolare quanto è alta la probabilità di default. In Marketing Il data mining è usato per calcolare il comportamento d'acquisto dei clienti e quali misure pubblicitarie interessano i potenziali clienti. Nei negozi online, si analizzano i carrelli della spesa e poi si cambiano i prezzi e il posizionamento dei prodotti. Inoltre, si possono cercare gruppi di destinazione per le campagne pubblicitarie e si possono esaminare i profili dei clienti. Su Internet, il Bigdata Mining è usato per rilevare attacchi, raccomandare servizi e analizzare le reti sociali. Altre aree di applicazione sono, per esempio, la medicina, la bibliometria e l'infermieristica.
Cose da sapere su Bigdata e Data Mining
I bigdata o il data mining possono essere considerati una disciplina neutrale a livello scientifico. Nel data mining, i dati provenienti da tutte le fonti immaginabili possono essere analizzati. Tuttavia, non appena i dati si riferiscono a una persona, possono sorgere rapidamente conflitti morali e legali. Questi per lo più non si riferiscono all'analisi dei dati, ma solo al processo di estrazione. I dati che non sono stati sufficientemente resi anonimi possono, in determinate circostanze, essere assegnati a individui specifici. Quando si esegue il data mining dei Bigdata, quindi, si deve sempre fare attenzione a garantire che i dati siano resi anonimi in modo tale che non si possano trarre conclusioni su individui o gruppi di individui. Oltre ai conflitti legali, bisogna notare che vengono sollevate questioni morali. È discutibile se i computer debbano essere autorizzati a dividere le persone in "categorie" o "classi". Nel data mining, per esempio, le persone sono ritratte come meritevoli o non meritevoli di credito. In generale, va notato che il processo stesso è estremamente neutrale e anonimo. La procedura non conosce le conseguenze e le probabilità del calcolo. Tuttavia, non appena le persone vengono messe a confronto con i dati in termini reali, per esempio da Schufa, questo può causare reazioni alienate, offese o sorprese. Al gigante dei motori di ricerca Google, a Google Analytics Dati sui gruppi target degli operatori del sito web forniti.
Opportunità e prospettive future
Nel mondo globalizzato, il data mining dei Big Data sta diventando sempre più rilevante. In passato, le aziende americane erano in grado di determinare se le loro clienti erano incinte o meno in base al loro comportamento d'acquisto. Sulla base di questi risultati, sono stati inviati in modo mirato buoni acquisto e consigli per gli acquisti, il che ha aumentato le vendite. Per la natura degli acquisti è stato persino possibile prevedere la data di nascita, anche se non il giorno. Il Data Mining di Big Data è oggi di grande importanza per le aziende. Attraverso il data mining mirato di Big Data, è possibile ottenere informazioni significative sugli utenti e sui potenziali clienti. Il data mining porta in ultima analisi a un aumento delle vendite e dei profitti e diventerà quindi ancora più importante in futuro. Non c'è da stupirsi: nel mondo globalizzato e tecnicamente abile, la raccolta dei dati è ormai normale e diventerà ancora più importante nel prossimo futuro.