データマイニングソフトウェアとは
データマイニングソフトウェアとは、データ・統計解析ソフトウェアのうち、大量のデータの解析に適したものです。
データマイニングとは、大量に蓄積されたデータからデータの中に存在する傾向を見つけ出す技術・手法を指します。データから「見つけ出す」ことに重点が置かれており、事象の背景についての仮説を立てたり、事象の発生を予測したりすることに役立つ手法です。
事例としては、顧客動向の分析を行いマーケティング活動に役立てるなどの企業活動に応用されています。
データマイニングソフトウェアの使用用途
1. マーケティング
データに基づいて顧客動向の分析を行い、マーケティング理論と組み合わせて販売活動を最適化するのが盛んに行われている活動です。顧客行動のデータから顧客ごと・階層ごとの行動傾向を抽出、あるいは新しい顧客セグメントを発見することで、新しい販売促進活動を検討できます。
顧客行動の分析の例としては、「最終購入日 (英: Recency) 」「購入頻度 (英: Frequency) 」「購入金額 (英: Monetary) に着目する手法があります(RFM分析)。例えば、最終購入後に再来店が無ければ、競合店に顧客を奪われているかもしれません。
また、行動に基づいて顧客を「優良」「優良候補」「新規」「休眠」等に分類し、それぞれに対するキャンペーンを検討することもできます。その他、施策の実施と効果の関係を分析し、施策の貢献度を評価することも可能です。
2. 研究
データマイニングは社会科学研究でも重視されつつあります。大量のデータに基づいて人々の行動を分析する研究に用いられます。
データマイニングソフトウェアの原理
規格外データ (データが一部欠落している等) の処理ルールを事前に決めておく機能、集計機能、アンケートを実施した場合の設問間の相互関係やテキスト分析機能を必要に応じて備えています。
集計には要約統計量の計算、関係性やセグメントの分析には相関・回帰分析、分類・クラスター分析、ネットワーク分析などが用いられます。
テキストマイニングは単語の出現頻度分析、感情と関係する単語と他の単語の関係分析などを用いて、人が文章を読むことなく内容を分析するものです。最近では、自然言語処理が活用されてきています。
データマイニングソフトウェアは大量のデータから知見を見出すため、データの視覚化 (英: Visualization) を重視しているのが特徴です。
データマイニングソフトウェアの種類
1. 機能面による分類
得意分野を異にするさまざまなソフトウェアがあります。分野の例は人工知能や機械学習、構造モデル、テキストマイニング、Webマイニングなどです。
2. ライセンス形態による分類
構成・機能が複雑であるため、すべての機能をオンプレミス (ユーザーが機器を設置) で動かすのでなく、クラウドサービスやSaaS (Software as a Service) になっているものが多いです。この場合はほとんどが年間ライセンス料を支払う形態です。オンプレミスの場合は、買い切りの場合と定期ライセンスの場合があります。
3. パッケージタイプ・開発可能タイプ
おすすめする解析をまとめて販売 (オンプレミスの買い切り、またはオンプレミス・クラウドサービス・SaaSのライセンス) するパッケージタイプのほか、ユーザーが自ら実施したい解析に沿ってプログラムを作成できるタイプもあります。
オープンソースのプログラムは無料のものが多いですが、サポートが受けられません。自身で使用方法を確認して活用する必要があります。なお、自身でプログラムが出来れば、一般的なツール (RやPythonなど) でデータマイニングプログラムを作成することも可能です。
ただし、業務として大規模に実施する場合には、総合的に見てパッケージタイプが適しているものと考えらえます。
データマイニングソフトウェアのその他情報
マーケティング用の機能強化
マーケティングに特化したソフトウェアは、特にマーケティングでよく用いる解析法を組み込み、容易に操作できるようになっています。最近では、Web上の情報を自動的に読み込み解析する機能 (Webマイニング) を持つものもあります。