...

Bigdata wird für große Konzerne zunehmend zu einer Herausforderung. Der Begriff „Big Data“ steht als Metapher für einen wertlosen Datenberg, in welchem nach Wissen gesucht werden soll. Mit Bigdata Mining werden statistische Methoden beschrieben mit welchen nach Trends, Querverbindungen und neuen Daten in Massendaten gesucht wird. Eine manuelle Verarbeitung solch riesiger Datenbestände ist nicht möglich, weshalb auf computergestützte Methoden zurückgegriffen werden muss. Diese Methoden können auch bei kleineren Datenmengen eingesetzt werden. Data Mining bezeichnet im Regelfall lediglich den Analyseschritt innerhalb des Prozesses.

Data Mining und Big Data

Mit Data Mining können erhebliche Datenmengen durch computergestützte Programme untersucht werden. Der Begriff Data Mining ist etwas irreführend, da es nicht um die Generierung von Daten geht, sondern um die Gewinnung von Wissen aus Daten. Der Begriff hat sich vor allem deshalb durchgesetzt, weil er kurz und präzise ist. Im Allgemeinen kann Data Mining als ein Prozess bezeichnet werden, bei dem Wissen extrahiert wird, das bisher unbekannt war und als potentiell nützlich betrachtet wird. Mit Bigdata werden Datenmengen beschrieben, die zu komplex oder groß sind oder sich einfach zu schnell ändern. Eine manuelle Erfassung oder Verarbeitung mit klassischen Methoden ist daher ausgeschlossen. Die gesammelten Bigdata, welche fürs Data Mining verwendet werden sollen, können aus allen möglichen Quellen stammen. Diese reichen von der elektronischen Kommunikation von Firmen und Behörden bis hin zu Aufzeichnungen von Überwachungssystemen. Der Wunsch nach der Analyse von Bigdata, um die gewonnenen Erkenntnisse zu nutzen, gerät oftmals in Konflikt mit den Persönlichkeitsrechten anderer Personen, weshalb sich im Vorhinein abgesichert werden sollte.

Data Mining und Big Data: Konventionelle Verfahrensweisen

Beim Data Mining von Big Data werden Selektionen und Datenerhebungen analysiert. Unvollständige Datensätze werden entfernt und wichtige Quellen oder Vergleichswerte hinzugefügt. Anschließend werden die Daten nach bestimmten Verhaltensmustern durchsucht und die gewonnenen Ergebnisse dargestellt. Diese werden von Experten untersucht und bewertet, sodass entschieden werden kann, ob das angestrebte Ziel erreicht werden kann. Das gewonnene Wissen wird bei erneuten Untersuchungen eingeschleust bzw. als Vergleichsparameter genutzt, damit die Ergebnisse der nächsten Suche noch exakter ausfallen. Während Data Mining bei Bigdata in früheren Zeiten vorrangig in der IT eingesetzt wurde, interessieren sich immer mehr Unternehmen für die verwendeten Methoden und das erhebliche Potential von Bigdata. Im Finanzsektor wird Data Mining zur Erkennung von Betrug und zur Rechnungsprüfung verwendet. Beim Kreditscoring wird anhand von Bigdata berechnet wie hoch die Wahrscheinlichkeit eines Zahlungsausfalls ist. Im Marketing wird mit Data Mining berechnet wie das Kaufverhalten von Kunden ausfällt bzw. für welche Werbemaßnahmen sich potentielle Kunden interessieren. Bei Online-Shops werden Warenkörbe analysiert und anschließend Preise und die Platzierung von Produkten abgeändert. Außerdem können Zielgruppen für Werbekampagnen gesucht und Kundenprofile untersucht werden. Im Internet dient Bigdata Mining der Erkennung von Angriffen, der Empfehlung von Diensten und der Analyse sozialer Netzwerke. Weitere Anwendungsgebiete sind beispielsweise die Bereiche Medizin, Bibliometrie und Pflegewesen.

Wissenswertes rund um Bigdata und Data Mining

Bei Bigdata bzw. Data Mining kann von einer Disziplin ausgegangen werden, die auf wissenschaftlicher Ebene als neutral zu bewerten ist. Beim Data Mining können Daten aus allen nur erdenklichen Quellen analysiert werden. Sobald sich die Daten jedoch auf eine Person beziehen, können schnell moralische und rechtliche Konflikte entstehen. Diese beziehen sich zumeist nicht auf die Auswertung der Daten, sondern lediglich auf den Prozess der Gewinnung. Daten die nicht hinreichend anonymisiert wurden, können unter Umständen bestimmten Personen zugeordnet werden. Bei der Durchführung von Data Mining von Bigdata ist daher stets auf eine Anonymisierung zu achten, die keine Rückschlüsse auf Personen oder Personengruppen zulässt. Zusätzlich zu den rechtlichen Konflikten ist anzumerken, dass moralische Fragen aufgeworfen werden. Es ist fraglich, ob Computer befugt sein sollten Menschen in „Kategorien“ bzw. „Klassen“ einzuteilen. Beim Data Mining werden Menschen beispielsweise als kreditwürdig oder -unwürdig dargestellt. Im Allgemeinen ist anzumerken, dass das Verfahren an sich äußerst wertneutral und anonym ist. Das Verfahren kennt die Folgen und Wahrscheinlichkeiten der Berechnung nicht. Sobald jedoch Menschen real mit den Daten konfrontiert werden, zum Beispiel durch die Schufa, kann dies befremdete, beleidigte oder überraschte Reaktionen hervorrufen. Beim Suchmaschinen-Giganten Google werden bei Google Analytics Daten über die Zielgruppen der Internetseiten-Betreiber bereitgestellt.

Möglichkeiten und Zukunftsaussichten

In der globalisierten Welt wird Data Mining von Big Data immer relevanter. Amerikanische Konzerne konnten in der Vergangenheit an dem Kaufverhalten ihrer Kundinnen erkennen, ob diese schwanger sind oder nicht. Anhand dieser Erkenntnisse wurden gezielt Einkaufsgutscheine und Einkaufshinweise versendet, wodurch der Umsatz anstieg. Durch die Art der Einkäufe war es sogar möglich das Datum der Geburt vorherzusagen, wenngleich nicht auf den Tag genau. Data Mining von Big Data ist heutzutage für Unternehmen von großer Bedeutung. Durch ein gezieltes Data Mining von Big Data können erhebliche Erkenntnisse über Nutzer und potentielle Kunden gesammelt werden. Data Mining führt im Endeffekt zu höheren Umsätzen und Gewinnen und wird daher in Zukunft noch wesentlich wichtiger werden. Kein Wunder: In der globalisierten und technisch versierten Welt ist die Sammlung von Daten mittlerweile normal und diese wird in naher Zukunft noch wesentlich stärker ausfallen.

 

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert