大数据正日益成为大型企业的挑战。"大数据 "这个词代表着一个隐喻,指的是一座毫无价值的数据山,在这座山里要搜索知识。大数据挖掘描述了用于搜索趋势、交叉联系和新数据的统计方法。 数据 是在海量数据中搜索到的。对如此庞大的数据集进行人工处理是不可能的,因此必须使用计算机辅助方法。这些方法也可以用于较小数量的数据。数据挖掘通常只指流程中的分析步骤。
数据挖掘和大数据
通过数据挖掘,大量的数据可以通过计算机辅助程序进行检查。数据挖掘一词有些误导,因为它不是关于生成数据,而是关于从数据中提取知识。这个词之所以流行,主要是因为它短小精悍。一般来说,数据挖掘可以被描述为一个过程,在这个过程中,提取以前未知的、被认为是潜在有用的知识。大数据用于描述过于复杂或庞大的数据量,或者只是变化太快。因此,人工录入或用经典方法处理是不可能的。收集到的用于数据挖掘的大数据可以来自所有可能的来源。从公司和当局的电子通讯到监控系统的记录,不一而足。为了使用所获得的知识而分析大数据的愿望,往往会与他人的人身权利发生冲突,因此建议提前保护自己。
数据挖掘和大数据:常规方法
大数据的数据挖掘涉及到分析选择和数据集合。删除不完整的数据集,增加重要的数据源或比较值。然后对数据进行特定行为模式的搜索,并将得到的结果呈现出来。这些都是由专家进行检查和评估,以便决定是否能够实现预期目标。所获得的知识会被反馈到新的调查中,或作为比较参数使用,以便下次搜索的结果更加准确。早期Bigdata的数据挖掘主要应用于IT领域,但越来越多的企业开始关注Bigdata的使用方法和可观的潜力。在金融领域,数据挖掘被用于欺诈检测和发票验证。在信用评分中,Bigdata被用来计算违约概率的高低。在 市场营销 通过数据挖掘来计算客户的购买行为,以及潜在客户对哪些广告措施感兴趣。在网店中,对购物车进行分析,然后改变商品的价格和摆放位置。此外,还可以搜索广告活动的目标群体,并检查客户档案。在互联网上,大数据挖掘被用于检测攻击、推荐服务和分析社交网络。其他的应用领域有,例如,医学、文献计量学和护理学。
关于大数据和数据挖掘的注意事项
大数据或数据挖掘可以说是一门科学层面上的中立学科。在数据挖掘中,可以分析所有可以想象到的来源的数据。然而,一旦数据提到人,就会很快产生道德和法律冲突。这些大多不是指数据的分析,而只是指提取数据的过程。在某些情况下,未充分匿名化的数据可以分配给特定的个人。因此,在对大数据进行数据挖掘时,必须始终注意确保数据的匿名化,不能得出关于个人或个人群体的结论。除了法律上的冲突外,还应该注意到道德问题。是否应该授权计算机将人分为 "类 "或 "类",值得商榷。例如,在数据挖掘中,人们被描绘成有信用价值或无信用价值。总的来说,需要注意的是,这个过程本身是极度价值中立和匿名的。程序不知道计算的后果和概率。然而,一旦人们真实地面对数据,比如舒法,就会引起疏远、冒犯或惊讶的反应。在搜索引擎巨头谷歌,在 谷歌分析 提供的网站运营商目标群体的数据。
机会和未来前景
在全球化的世界里,大数据的数据挖掘变得越来越重要。过去,美国公司可以根据顾客的购买行为来判断顾客是否怀孕。根据这些调查结果,有针对性地发送购物券和购物提示,提高了销售额。由于购买的性质,甚至可以预测出出生日期,虽然没有到当天。从大数据中进行数据挖掘,对于当下的企业来说是非常重要的。通过大数据有针对性的数据挖掘,可以获得关于用户和潜在客户的重要见解。数据挖掘最终会带来更高的销售额和利润,因此在未来将变得更加重要。难怪:在全球化和技术化的世界里,数据收集已经成为常态,在不久的将来会变得更加重要。