A bigdata egyre nagyobb kihívást jelent a nagyvállalatok számára. A "Big Data" kifejezés metafora az értéktelen adathegyre, amelyben a tudást kell keresni. A bigdata mining a trendek, keresztkapcsolatok és új adatok keresésére használt statisztikai módszereket írja le. Adatok a tömegadatokban keresik. Az ilyen hatalmas adathalmazok kézi feldolgozása nem lehetséges, ezért számítógépes módszereket kell alkalmazni. Ezek a módszerek kisebb adatmennyiségek esetében is alkalmazhatók. Az adatbányászat általában csak a folyamaton belüli elemzési lépésre utal.
Adatbányászat és Big Data
Az adatbányászattal jelentős mennyiségű adatot lehet számítógépes programokkal vizsgálni. Az adatbányászat kifejezés némileg félrevezető, mivel nem az adatok előállításáról, hanem az adatokból való tudás kinyeréséről szól. A kifejezés elsősorban azért vált népszerűvé, mert rövid és pontos. Általánosságban az adatbányászat olyan folyamatként írható le, amely a korábban ismeretlen és potenciálisan hasznosnak ítélt tudás kinyerésére irányul. A bigdata kifejezéssel olyan adathalmazokat jelölünk, amelyek túl összetettek vagy nagyok, vagy egyszerűen túl gyorsan változnak. A kézi gyűjtés vagy a klasszikus módszerekkel történő feldolgozás ezért szóba sem jöhet. Az adatbányászathoz felhasználandó összegyűjtött Bigdata mindenféle forrásból származhat. Ezek a vállalatok és hatóságok elektronikus kommunikációjától a felügyeleti rendszerek nyilvántartásáig terjednek. A nagy mennyiségű adat elemzésére irányuló törekvés, hogy az így nyert felismeréseket felhasználhassuk, gyakran ütközik más emberek személyiségi jogaival, ezért fontos, hogy ezeket a jogokat előzetesen biztosítsuk.
Adatbányászat és Big Data: hagyományos módszerek
A Big Data adatbányászat magában foglalja a kiválasztások és adatgyűjtemények elemzését. A hiányos adatkészleteket eltávolítjuk, és fontos forrásokat vagy összehasonlítási értékeket adunk hozzá. Ezután az adatokban meghatározott viselkedési mintákat keresnek, és a kapott eredményeket bemutatják. Ezeket szakértők vizsgálják és értékelik, hogy döntés születhessen arról, hogy a kitűzött cél elérhető-e. A megszerzett ismereteket az újabb vizsgálatokba táplálják be, vagy összehasonlítási paraméterként használják fel, hogy a következő kutatás eredményei még pontosabbak legyenek. Míg korábban a Bigdata adatbányászatot elsősorban az informatikában alkalmazták, egyre több vállalat érdeklődik a módszerek és a Bigdatában rejlő jelentős lehetőségek iránt. A pénzügyi ágazatban az adatbányászatot csalás felderítésére és számlaellenőrzésre használják. A hitelpontozásban a Bigdata segítségével kiszámítják, hogy mekkora a nemfizetés valószínűsége. A oldalon. Marketing Az adatbányászatot arra használják, hogy kiszámítsák a vásárlók vásárlói magatartását és azt, hogy a potenciális vásárlók milyen hirdetési intézkedések iránt érdeklődnek. Az online boltokban a bevásárlókocsikat elemzik, majd megváltoztatják az árakat és a termékek elhelyezését. Ezen túlmenően a reklámkampányok célcsoportjai kereshetők és az ügyfélprofilok vizsgálhatók. Az interneten a Bigdata Mining a támadások felderítésére, szolgáltatások ajánlására és a közösségi hálózatok elemzésére szolgál. További alkalmazási területek például az orvostudomány, a bibliometria és az ápolás.
Amit a Bigdata és az adatbányászatról tudni kell
A bigdata vagy adatbányászat tudományos szinten semleges tudományágnak tekinthető. Az adatbányászat során minden elképzelhető forrásból származó adat elemezhető. Amint azonban az adatok egy személyre vonatkoznak, gyorsan erkölcsi és jogi konfliktusok merülhetnek fel. Ezek többnyire nem az adatok elemzésére, hanem csak a kinyerés folyamatára vonatkoznak. A nem kellően anonimizált adatok bizonyos körülmények között konkrét személyekhez rendelhetők. A Bigdata adatbányászatakor ezért mindig ügyelni kell arra, hogy az adatok anonimizálása oly módon történjen, hogy ne lehessen következtetéseket levonni egyénekre vagy egyének csoportjaira vonatkozóan. A jogi konfliktusok mellett meg kell jegyezni, hogy erkölcsi kérdések is felmerülnek. Kérdéses, hogy a számítógépeknek engedélyezni kellene-e az emberek "kategóriákba" vagy "osztályokba" való felosztását. Az adatbányászatban például az embereket hitelképesnek vagy nem hitelképesnek ábrázolják. Általánosságban meg kell jegyezni, hogy maga a folyamat rendkívül értéksemleges és anonim. Az eljárás nem ismeri a számítás következményeit és valószínűségeit. Amint azonban az emberek szembesülnek az adatokkal a valóságban, például a Schufa által, ez elidegenedett, sértett vagy meglepett reakciókat válthat ki. A keresőmotor óriás Google, a Google Analytics A weboldal üzemeltetőinek célcsoportjaira vonatkozó adatok.
Lehetőségek és jövőbeli kilátások
A globalizált világban a nagy adatok adatbányászata egyre fontosabbá válik. A múltban az amerikai vállalatok képesek voltak megállapítani vásárlóik vásárlási magatartásából, hogy terhesek-e vagy sem. Ezen ismeretek alapján célzott vásárlási utalványokat és vásárlási tippeket küldtek ki, ami növelte az eladásokat. A vásárlások természetéből adódóan még a születési dátumot is meg lehetett jósolni, bár nem napra pontosan. A Big Data adatbányászat manapság nagy jelentőséggel bír a vállalkozások számára. A Big Data célzott adatbányászata révén jelentős betekintést lehet nyerni a felhasználókról és a potenciális ügyfelekről. Az adatbányászat végső soron magasabb értékesítést és nyereséget eredményez, ezért a jövőben sokkal fontosabbá válik. Nem csoda: a globalizált és technológiailag fejlett világban az adatgyűjtés normálisnak számít, és a közeljövőben még inkább előtérbe kerül.