• facebookロゴ
  • twitterロゴ

明日のワクワクを創り出すビジネスメディア

  1. HOME
  2. IM-Press
  3. お役立ち情報
  4. データマイニングとは? ~分析手法の種類から活用事例まで解説~

データマイニングとは? ~分析手法の種類から活用事例まで解説~

データマイニング(data mining)とは、ビッグデータなどの大量のデータから価値のある示唆を見つけ出すことです。鉱山から有用な鉱物資源を採掘することになぞらえて「マイニング(mining/採鉱)」とよばれます。

製造、金融、農業、流通、医療、教育…業界や分野を問わず、期待が集まるビッグデータ活用。ビッグデータの活用について考える上でのが「データマイニング」です。

本コラムでは、データマイニングの概要と分析手法、活用事例をご紹介いたします。

 

1. データマイニングとは

データマイニング(data mining)とは、ビッグデータなどの大量のデータから価値のある示唆を見つけ出すことです。鉱山から有用な鉱物資源を採掘することになぞらえて「マイニング(mining/採鉱)」とよばれます。

具体的には、データに対して統計学やパターン認識(クラスタリング、マーケットバスケット分析など)、人工知能(AI)などを活用してデータ解析を行い、役立つ知見を探り当てることをいいます。

なお、「データ分析」がある性質などを明らかにするためにデータを複数の要素に分けるものであるのに対し、「データ解析」ではある仮説などを確かめるためにデータを用いて論理的に明らかにすることを差します。

データマイニングには、対象となるデータが文字情報「テキストマイニング」、Webサイト上のデータを対象とする「Webマイニング」などがあります。

データマイニングは、データに対して統計学やデータ分析・データ解析などでアプローチして有益な知見を得る学問「データサイエンス」の一領域です。

【関連記事】
データサイエンスとは?どのように活用するのかをシーン別でご紹介

 

2. データマイニングの分析手法の種類

データマイニングに使われる主な分析手法として、「ロジスティック回帰」「クラスター分析」「マーケットバスケット分析」などが挙げられます。

ロジスティック回帰分析

ロジスティック回帰分析とは、複数の要因(説明変数)から、「Yes/No」「合格/不合格」「当たり/外れ」など答えが2つしかない値(2値)の目的変数の確率を説明・予測する分析手法です。

ロジスティック回帰分析に必要なデータの特徴として、不完全なデータは使用できない、有意差のないデータは使用できないなどが挙げられます。
また、必要なデータの構造が単純で、かつ、大量であるため、機会学習での処理が最適です。

マーケティングはもちろん、医療や災害といった、分析結果に高い精度が求められる分野でも活用されている分析手法です。

【関連記事】
機械学習 モデルとは? ~主な種類と選ぶポイント~

クラスター分析(クラスタリング)

クラスター分析とは、特性ごとに集団に分ける分析手法で、「クラスタリング」ともよばれます。そもそも、クラスター(cluster)とは「ブドウの房」を意味する単語で、そこから「一定の属性で分けられたグループ」を指す言葉として使われています。

クラスター分析における「特性」とは、「性別」「年齢」「職業」といったデモグラフィック(人口統計学的属性)なものではなく、「雰囲気」「価値観」「意識」といった定義しづらいものである点が特徴です。

階層的な構造を持つ「階層クラスター分析」と、階層的な構造を持たない「非階層クラスター分析」の2つに分けられます。

クラスター分析ではデータを分類するだけなので、うまく示唆が得られないことも考えられます。その場合は、上記のロジスティック回帰分析などを組み合わせて分析を行う必要があります。

マーケットバスケット分析(バスケット分析、アソシエーション分析)

マーケットバスケット分析とは、属性の異なるデータ間で相関関係を見出す分析手法で、バスケット分析、アソシエーション分析ともよばれます。

たとえば、「もしこれを買うなら、これも一緒に買うだろう」という予測を数値で定義することができます。一見、関連性のない商品が同時に買われることが多いなどの相関性を発見できるため、オンラインショップのレコメンドなどに活用されています。

データマイニングというと必ずといって良いほど例に上がる「おむつとビール」。米国におけるマーケットバスケット分析の有名な事例で、大手のスーパーマーケット・チェーンで、おむつを買う人はビールも一緒に買う傾向があることがわかったというものです。調査してみると、かさばるおむつは妻が夫に買い物を頼むことが多いことがわかり、おむつ売り場にビールを置いたところ、売り上げが伸びたといわれています。

 

3. データマイニングの活用例

最後に、データマイニングを具体的にどのように活用すると、どのようなメリットが得られるのでしょうか?活用例を業界・分野別にご紹介いたします。

製造業

製造業では、工場の生産ラインにセンサーを設置してデータを収集し、データマイニングを行います。

まず、製品の質や、生産性を向上するために、歩留りやサイクルタイムを分析したり、品質低下の原因を突き止めて改善するといった活用法があります。

また、生産ラインの機器が故障するタイミングや箇所、原因を特定することで、メンテナンスを最適化することができます。メンテナンスでも故障でも生産ラインを止める必要があるため、必要最小限に抑えられれば大きなメリットです。

小売業

小売業では、過去の販売データから、季節や曜日・天候・時間帯などによって販売予測を立て、在庫の最適化に活用されています。

また、顧客の過去の購入データからおすすめ商品をリコメンドしたり、顧客の属性や特徴ごとに最適なコミュニケーションを行うことで、顧客満足度を向上させ、リピーターやロイヤルカスタマーを醸成することにも活用できます。

サブスクリプションモデルの販売方式を採用しているケースでは、過去の解約データから、これから解約されそうな顧客を洗い出して、クーポンを送付するなどリテンションを行い、解約を未然に防ぐこともできます。

金融・保険業

金融業では、顧客が普段、利用している支店やATMの場所、決済金額といった行動パターンを元に、キャッシュカードの盗難やクレジットカードのスキミングなどを検知し、不正利用を最小限に抑えるのに役立ちます。

保険業においては、過去の加入者への保険金の支払い状況と、加入者の属性データなどから、加入希望者への支払い額の予測を立て、保険料を決めるのに役立ちます。
また、小売業と同様に、解約防止にも活用できます。

医療・健康

医療分野では、過去のカルテから、データマイニングにより、患者の特性ごとに効果の高い治療法を導き出すことができます。医療におけるデータマイニングは特に「医療データマイニング」とよばれます。

健康分野では、保健師が指導した記録をデータマイニングして、どのような特徴の人にどのような指導をするのが効果的であるかを把握するのに役立てることができます。

教育

教育分野では、大学が学生の卒業見込みを測るのにデータマイニングを活用できます。各学生の卒業や単位取得、編入、継続、在籍の見込みを数値で把握し、たとえば、卒業できない確率の高い生徒には、個別にアドバイスを行ってサポートするといった対応が可能になります。

公共

データマイニングは、公共にも役立てられています。たとえば、天気予報もデータマイニングの一例です。過去の気象データを解析することで予報を行っています。市町村レベルの局所的な天気についても、スマホアプリからユーザーの位置情報とともに天気データを送信してもらうことで、ゲリラ豪雨のように局所的・突発的な天気も予測できるようになりました。

また、公共交通機関のピーク時の利用者とオフピーク時の利用者の属性をデータマイニングによって分析し、混雑緩和策を立てるためにも活用できます。

 

4. まとめ

近年、ビッグデータの活用が叫ばれていますが、データマイニングはそれ以前から活用されてきました。ビッグデータの蓄積・分析によって、データマイニングで得られる価値の種類や精度は、さらに向上したといえます。

データマイニングは、一見関連のない者同士の相関性が見つかるなど、ほかの方法では得られない価値が得られることから、業界を問わず、さまざまな分野で活用が広がり、今後に期待が集まっています。

 

Concept Book

ローコード開発・業務プロセスのデジタル化で豊富な実績を持つintra-martが、お客様のビジネスにどのような効果をもたらすのか、特長や導入効果など製品コンセプトを詳しくご紹介しています。

Concept Book

お困りごとがありましたら、お気軽にご相談頂ければと思います。

お役立ち資料ダウンロード

お役立ち資料