マーケティングに不可欠。データマイニングって?
ビッグデータの活用と言えば、日々大量の情報が集まる大企業だけが実現できるものであり、わが社は無縁だ。なんて思っていませんか?
ビッグデータという言葉が独り歩きしているため、そこにある本質が見えにくくなっているだけです。
データは集めようと思えばいくらでも集めることができるはずです。ITビジネスならなおさら。ホームページに集まる顧客の声、SNSの投稿、利用者の声など、一見意味もない情報のかたまりが、企業経営やマーケティングを成功させるための一粒のダイヤモンドになる可能性を秘めています。
それらのデータを活かす手法が、データマイニングです。
データマイニングとは
データマイニングは、たくさんのデータを中から、規則性や関連性(ルール)など意味のパターンを自動的に抽出する手法です。
顧客が製品やサービスを購入する際、通常では把握しきれない「隠れた法則」の存在を導き出すことができれば、マーケティング上非常に有意です。
なぜかというと
- アフィリエイト経由の購入者はリピート購入率が低い
- 男性/既婚/勤続年数15年以上の人は特定の商品購入率が高い
- 女性/60歳以上/3大都市以外の居住者はネットからの購入がない
といった、肌感覚、あるいはある種常識的な考えを、データマイニングに掛けることでルール化でき、そのルール化が効果的でムダのないマーケティング施策の設計に有効となるからです。
もちろん、肌感覚で持っていた仮説の検証だけでなく、新たな知識や、仮説が発掘されることもしばしばあります。
仮説の検証を行うデータマイニング、知識の発見を目的とするデータマイニング、この両面がデータマイニングの魅力でもあります。
データマイニングで行う処理
掛け合わせるデータは膨大な物になりますが、データマイニングの工程自体はそれほど複雑ではありません。
基本的に、データの抽出、並べ替え、グルーピング、性質の把握、データとデータの関係性の把握、という5工程の一部か、適宜組み合わせたもの、あるいはすべての工程を経て、有意なデータを抽出していくものです。
では細かく見ていきましょう。
- データの抽出
データクレンジングと呼ばれるもので、取得データから分析対象のデータだけを抽出していきます。たとえば商品に対するユーザーのコメントを抽出したい場合、そのほかのデータは不要となります。そのほか売上が上がっている商品(下がっているもの)、特定商品の購入経験者、顧客属性の抽出など。
- 並べ替え
データを並べ替える処理です。売れている順、売れそうな順、たくさん商品を買っている顧客順、最近買われた商品の個数順など
- グルーピング
商品や顧客を並べ替える処理です。商品なら家庭用品、嗜好品、アパレル製品などの属性はもちろん、利益率の高いもの(低い物)など。顧客なら、男性・女性、世代別、ある商品を購入した人など
- 性質の把握
グルーピングに対する個別のデータ抽出です。売上に関する数字が出る場合は、一定期間の販売個数や平均単価などを算出できます。家庭用品の月額売上と平均単価、ある特定の商品群における男性30代の月額売上・平均単価など、グループごとの特色を把握していきます。
- データとデータの関係性の把握
あるデータ群において、ある変数を与えた場合、特殊な傾向が見られる場合があります。
たとえばトレーニング用品の売上や販売数量を元データ群とし、気温が何度くらいならどれくらいの売上があるのか、といった細かい傾向を見ていくような形です。
同様に30代女性がどんな商品をよく購入するのか、季節や気温、その日の天気などとの関連性はあるのか、と言った条件を変数にして、今までのデータ分析では見えてこなかった傾向や、肌感覚でつかんでいた傾向にデータ的な裏付けを行うことができます。
まとめ
今回はデータマイニングについてざっくりと説明しました。次回はデータマイニングの種類について取り上げ、マーケティングの課題解決に絡めた処理方法、統計的手法を見ていきましょう。