ビッグデータは大企業の課題になりつつあります。ビッグデータ」という言葉は、知識が検索される無価値なデータの山を暗喩している。ビッグデータマイニングでは、トレンド、クロスコネクト、新しいデータを検索するために使用される統計的手法について説明しています。 データ をマスデータで検索します。このような巨大なデータセットを手動で処理することは不可能であり、そのためにコンピュータ支援法を使用しなければならない。これらの方法は、データ量が少ない場合にも使用できます。データマイニングは通常、プロセス内の分析ステップのみを指します。
データマイニングとビッグデータ
データマイニングでは、かなりの量のデータをコンピュータ支援プログラムで調べることができます。データマイニングという言葉は、データを生成することではなく、データから知識を抽出することを目的としているため、やや誤解を招きやすい。主に短くて正確な言葉ということで人気が出てきました。一般的にデータマイニングは、これまで知られていなかった知識を抽出し、潜在的に有用であると考えられる知識を抽出するプロセスと表現することができる。ビッグデータは、複雑すぎたり、大きすぎたり、単に変化が早すぎたりするデータの量を表現するために使用されます。そのため、手入力や古典的な方法での処理は不可能です。データマイニングに使用するために収集されたビッグデータは、あらゆる可能性のあるソースから入手することができます。これらは、企業や当局からの電子的なコミュニケーションから、監視システムからの記録まで多岐にわたります。得た知識を利用するためにビッグデータを分析したいという欲求は、他人の個人的な権利と相反することが多いので、事前に自分の身を守ることをお勧めします。
データマイニングとビッグデータ:従来の手法
ビッグデータのデータマイニングでは、選択とデータ収集の分析が行われます。不完全なデータセットが削除され、重要なソースまたは比較値が追加されました。その後、データから特定の行動パターンを検索し、得られた結果を提示する。これらは、意図した目標が達成できるかどうかの判断ができるように、専門家によって検討され、評価されます。得られた知識は、新たな調査にフィードバックされたり、比較パラメータとして使用されたりして、次の調査の結果がより正確になるようにしています。Bigdataのデータマイニングは、以前は主にIT分野で利用されていましたが、最近では利用されている手法やBigdataのかなりの可能性に興味を持つ企業が増えてきています。金融分野では、不正検知や請求書の確認などにデータマイニングが活用されています。クレジットスコアリングでは、デフォルトの確率がどれだけ高いかを計算するためにBigdataを使用しています。で マーケティング データマイニングは、顧客の購買行動を計算し、潜在的な顧客がどの広告施策に興味を持っているかを計算するために使用されます。ネットショップでは、ショッピングカートを分析して、価格や商品の配置を変更しています。さらに、広告キャンペーンのターゲットグループを検索したり、顧客プロファイルを調べたりすることができます。インターネット上では、攻撃の検知、サービスの推奨、ソーシャルネットワークの分析などにBigdata Miningが利用されています。他の応用分野としては、例えば、医学、ビブリオメトリクス、看護学などがあります。
ビッグデータとデータマイニングについて知っておくべきこと
ビッグデータやデータマイニングは、科学的なレベルでは中立的な学問と考えることができます。データマイニングでは、考えられるすべてのソースからのデータを分析することができます。しかし、データが個人を指すようになると、すぐにモラルや法的な対立が生じることがあります。これらはほとんどの場合、データの分析を指すものではなく、抽出のプロセスのみを指すものです。十分に匿名化されていないデータは、状況によっては特定の個人に割り当てることができます。したがって、ビッグデータのデータマイニングを行う際には、個人や個人のグループについての結論を導き出せないように、データが匿名化されていることを常に確認するように注意しなければなりません。法的な対立に加えて、道徳的な問題が提起されていることにも注意が必要です。コンピュータが人を「カテゴリー」や「クラス」に分けることを認可すべきかどうかは疑問である。例えば、データマイニングでは、人は信用できる人、信用できない人として描かれます。一般的には、プロセス自体が極めて価値中立的で匿名性が高いことに留意すべきである。手続きは計算の結果や確率を知りません。しかし、シューファのように、人々が実際にデータと向き合うとすぐに、疎外されたり、気分を害されたり、驚いたりする反応を起こすことがあります。検索エンジン大手のグーグルでは グーグルアナリティクス 提供されたサイト運営者のターゲット層に関するデータ
機会と今後の展望
グローバル化した世界では、ビッグデータからのデータマイニングがますます重要になってきています。かつてアメリカの企業は、顧客が妊娠しているかどうかを購買行動から判断していました。これらの知見をもとに、買い物券や買い物のヒントを的中させて発信することで、売上を伸ばすことができました。購入の性質上、当日までではありませんが、生年月日を予想することすら可能でした。ビッグデータからのデータマイニングは、今日の企業にとって非常に重要です。ビッグデータからターゲットを絞ったデータマイニングを行うことで、ユーザーや潜在的な顧客に関する重要な洞察を得ることができます。データマイニングは最終的には売上や利益の向上につながるため、今後ますます重要になってくるでしょう。当たり前のことですが、グローバル化した技術に精通した世界では、データ収集はもはや当たり前のことであり、近い将来にはさらに重要になるでしょう。