1. HOME
  2. IM-Press
  3. お役立ち情報
  4. 重回帰分析とは? ~目的から手順や注意点までわかりやすく解説~

重回帰分析とは? ~目的から手順や注意点までわかりやすく解説~

重回帰分析とは? ~目的から手順や注意点までわかりやすく解説~

重回帰分析とは、回帰分析のうちで説明変数(独立変数)が複数あるものを指します。なお、回帰分析とは説明変数と従属変数の関係性を推定するための統計的手法のことを、説明変数とは因果関係を検討する際にある要因によって結果に影響を及ぼしたり、及ぼすことが推測されたりする変数のことをいいます。

重回帰分析を行うことで、まだデータの得られていない項目について、根拠のある予測が可能になります。たとえば、売上予測や顧客満足度の分析などに活用できます。

本コラムでは、重回帰分析を利用する目的やメリット・デメリット、エクセルを用いた重回帰分析の方法などについて、ご紹介いたします。

 

重回帰分析とは

重回帰分析とは、回帰分析のうち、説明変数が複数あるものを指します。
たとえば、小売店で売上に影響する要素には、立地(駅からの距離など)、売り場面積、商品数などさまざまなものがあります。こうした要素のうち、どれがどれだけ大きな影響を与えているのかを分析できるのが重回帰分析です。

重回帰分析は、多変量解析の一つです。多変量解析とは、2つ以上の変数を持つデータの関連性を分析する統計手法のことです。
多変量解析について詳しくは、下の「その他の分析手法」をご覧ください。

単回帰分析と重回帰分析の違い

回帰分析のうち、説明変数が1つのものを単回帰分析といいます。
重回帰分析では単回帰分析と異なり、複数の変数で分析するため、より実用的な分析が可能になります。

なお、説明変数とは、因果関係を検討する際に、ある要因によって結果に影響を及ぼす、または及ぼすことが推測される変数のことです。説明変数とも呼ばれます。

重回帰分析の目的

ビジネスで重回帰分析を活用する目的は、次の2点です。

結果に関連のありそうな変数を使って予測を行う

重回帰分析は、未来に対する予測に活用することができます。

たとえば、「接客の質や品数、売場面積などを変数とした小売店の売上予測、訪問回数や値引率、広告費などを変数とした受注予測」「人材の性格や指向、成績などを変数としたハイパフォーマーの条件」などを予測して、利益に結び付けることが可能になります。

結果に対する要因(変数)の分析を行う

重回帰分析とは」でご紹介したように、重回帰分析は、結果に対してどの要因がどの程度、影響を与えているかを分析することもできます。

たとえば、接客の質や支払い手段の豊富さ、品揃え、商品の品質の高さといった変数の顧客満足度への影響度、高級さや話題性、デザインの良さといった変数がブランドイメージに与える影響度など、結果に関連のありそうな要因のうち、どれが大きな影響を与えたためにその結果が出たのかを分析することが可能です。

重回帰分析のメリット・デメリット

重回帰分析を活用する上で知っておきたいメリットとデメリットをご紹介いたします。

重回帰分析のメリット

まずは、重回帰分析のメリットからご紹介いたします。
重回帰分析のメリットには、単回帰分析と共通のものに加え、重回帰分析に特有のメリットがあります。

データを根拠として示せる(単回帰分析と共通のメリット)

単回帰分析もそうですが、回帰分析は、実際の数値に基づいて分析を行い、その結果、相関関係の有無や影響度、予測を行うため、根拠となる数値を示すことができます。
このため、分析結果に基づくプレゼンや説得の効果が期待できます。

未来についての予測ができる(単回帰分析と共通のメリット)

重回帰式に計画上の数値を入力することで、未来の予測が行える点もメリットです。
たとえば、将来の人口予測といったことも可能なので、出店計画などに利用できます。
まだデータが得られない時点で将来の見通しが立つため、さまざまなビジネス戦略に活用することが可能です。

実用性の高い分析が可能(重回帰分析に特有のメリット)

上記2点は、単回帰分析でも得られるメリットですが、変数が一つしかない単回帰分析に比べ、複数の変数を扱うことのできる重回帰分析は実用性が高く、より現実的な分析・予測に活かせます。

重回帰分析のデメリット

一方、重回帰分析にもデメリットが存在します。

概念や計算が複雑で、理解しづらい

重回帰分析を行う際は、「重回帰分析の手順」でお伝えするように、重回帰式を立てる必要がありますが、概念はもとより計算が複雑なため、自力で一から計算式を作ることは現実的ではありません。多くの場合、Excelや専用のソフトウェアを使用します。

剰余変数が結果に影響を与えている可能性がある

剰余変数とは、説明変数以外で結果の原因となる可能性がある変数のことをいいます。これを考慮して結果を見る必要があります。
剰余変数は、撹乱要因となる変数であるため、分析の実施者が統制するべきものといえます。

多重共線性が生じる恐れがある

多重共線性とは、説明変数同士の中で相関性の高いものが存在することをいいます。マルチ・コリニアリティ(multi-colinearity)を略した「マルチコ」の名で呼ばれることも多いです。
本来は、結果である目的変数と、これに影響を及ぼす説明変数の関係性を分析したいのですが、説明変数の中に相関性の高い組み合わせがあることで、結果の分析に必要な説明変数が足りなくなってしまい、正しい分析が行えなかったり、分析そのものが行えなくなったりします。

重回帰分析の手順

重回帰分析を行う手順は、以下の5ステップです。

1.成果(目的変数)を定義する

まずは、結果や成果である目的変数を定義します。
たとえば、「新規に出店する店舗の売上を予測したい」のなら、新規に出店する店舗の売上額が、「顧客満足度に貢献している要素を知りたい」のなら、顧客満足度が目的変数となります。

2.成果に影響する要因(説明変数)を抽出する

次に、目的変数へ影響を与えている、もしくは与えるであろう説明変数をピックアップしていきます。

たとえば、飲食店の売上高を予測する場合は、駅からの距離、店舗面積、メニュー数、客単価、従業員数などが要因の候補となります。

3.データを収集し、解析する

2で抽出した要因候補のデータを、エクセルや無料・有料の重回帰分析に対応した統計ソフトを活用して、解析します。

要因の候補を、一つひとつ減らしたり戻したりしながら、最適な組み合わせを探っていきます。
なお、最適な説明変数の数は、重回帰分析に利用できるサンプルデータ数÷15までだといわれています。

説明変数が決まり、解析すると、重回帰式が得られます。

4.得られた重回帰式から目的変数を算出する

3で得られた重回帰式を用いて予測を行う場合は、計画データを代入して目的変数を算出します。

5.結果をもとに施策を講じる

3で得られた説明変数の影響度や、4で得られた目的変数を、実際の施策に反映すべく、施策を検討・立案します。

たとえば、新規顧客獲得にかかるコストを下げたい場合、購入に結び付く要因として、広告費の影響度が低いことがわかれば削減するといった具合です。

エクセルを用いた重回帰分析の方法

概念や計算が複雑で、理解しづらい」でもお伝えしましたが、重回帰分析を手作業で行うことは現実的ではありません。
そこで、エクセルや専用のソフトウェアを活用します。

ここでは、使い慣れたエクセルを活用した重回帰分析の方法をご紹介いたします。

「分析ツール」を設定する

初期設定のままではエクセルを分析ツールとして使うことはできません。以下の方法で分析ツールが使えるように設定しましょう(※Office365 バージョン2303の場合)。

(1)エクセルを立ち上げた状態で「ファイル」を選択する。
(2)さらに「オプション」を選択する。
(3)ウインドウが開くので「アドイン」を選択する。
(4)「分析ツール」を選択する。
(5)「OK」を押す。

分析データを入力する

エクセルの設定が済んだら、実際に分析したデ-タを用意します。
データの項目ごとエクセルのシート上に貼り付け、メニューバーの「デ-タ」から「デ-タ分析」を選択します。
ウインドウが開くので、さらに「回帰分析」を選択します。

分析ツールで変数を設定する

さらに、X軸とY軸の分析範囲(変数)を設定していきます。
X軸は、説明変数です。分析対象の説明変数を指定しましょう。
Y軸は、目的変数です。分析対象の目的変数を指定しましょう。

併せて、「ラベル」と「出力オプション」も設定しましょう。
ラベルは、設定した分析対象データの変数にデータ名が含まれる場合に指定します。
出力オプションでは、分析結果のデータの出力先を指定できます。

分析結果を確認する

上記の設定をすべて完了して「OK」を押すと、結果が出力されます。
その結果を確認して評価を行います。

評価は、以下の4つの観点から行いましょう。

有用な回帰式かどうか

上記の手順で設定すると、回帰式が求められます。
まずは、この回帰式が有用なものであるかどうかを確認する必要があります。

表示された分散分析表の中の「有意F」を見て、0.05よりも小さい値であれば、その回帰式が有用なものであると判断できます。

回帰式の精度はどうか

有用な回帰式であることが確認できたら、今度は、得られた回帰式の精度を確認する必要があります。
回帰式の精度は、表示された分析結果の表の中の「補正R2」の値を見ることで確認できます。
補正R2の値が0に近いほど精度が低く、1に近いほど精度が高いと判断できます。

有用な係数かどうか

次に、回帰式の係数が有用なものであるかどうかを確認します。
有用な係数かどうかは、表示された分析結果の表の中の「P-値」で判断できます。
これも、「P-値」が0.05よりも小さい値であれば、有用なものであるといえます。

説明変数の影響度はどうか

最後に、分析の目的の一つでもある、各説明変数の影響度の高さを確認していきます。
説明変数の影響度は、表示された分析結果の表の中の「t」を見ることで判断できます。
「t」の絶対値が大きいほど、目的変数に与える影響が大きいといえます。

その他の分析手法

重回帰分析とは」でもお伝えしたように、重回帰分析は、2つ以上の変数を持つデータの関連性を分析する統計手法である多変量解析の一つです。
そして、多変量解析には、重回帰分析以外にもさまざまなものがあります。
また、多変量解析以外にも、分析手法はたくさんあります。

重回帰分析ではうまくいかなかった分析は、ほかの分析方法の方が適している可能性もあります。
重回帰分析以外の分析手法を知ることで、最適なものを選べるようになるでしょう。
ここで、重回帰分析以外の分析手法の中から代表的な手法をご紹介いたします。

数量化I・II・III類

数量化とは、正式には数量化理論といい、数値データではないデータ(質的データ)を分析するために作られた、日本独自の多次元データ分析法です。
数量化にはI類、II類、III類、IV類、V類、VI類までの6つの手法があり、このうちよく活用されている、I・II・III類についてご紹介します。

数量化I類

数量化I類では、質的データに強制的に数値を割り付けた後で、回帰分析を行います。

例)飲酒や喫煙の有無から、がんを発症する確率を予測する。

数量化II類

数量化II類では、判別分析を行います。
判別分析では、数量化I類とは逆に、量的データから質的データを予測して、グループ分けを行います。

例)化粧品のマーケティングリサーチで、各化粧品に項目で点数を付けてもらった後で「とろみのある商品」と「香りの良い商品」のどちらが顧客に求められているかを分析する。

数量化III類

数量化III類では、主成分分析あるいは因子分析を行います。
主成分分析とは、多変量解析の一つで、複数の説明変数をまとめて合成変数にしたり、少ない指標に要約したりする手法です。
つまり、数量化III類では、複数の質的な説明変数を、少ない変数へ要約します。

例)顧客へのアンケート結果から、ブランドのポジショニングを決める。

判別分析

数量化II類」でもお伝えしたように、判別分析では量的データから質的データを予測します。その上で、2つのグループに振り分けます。

例)ターゲット層の業種や企業規模などから、契約・非契約を予測する。

ロジスティック回帰分析

ロジスティック回帰分析では、複数の説明変数から「Yes/No」「合格/不合格」のように答えが2つしかない値の目的変数の確率を説明・予測します。

判別分析との違いは、「Yes/Noのどちらになるか」ではなく「Yes/Noになるそれぞれの確立」を予測する点です。

例)ターゲット層の業種や企業規模などから、契約の可能性(%)を予測する。

主成分分析

主成分分析では、「数量化III類」でお伝えしたように、複数の説明変数をまとめて合成変数にするなどして要約し、わかりやすくします。

例)5科目のテストを実施した結果を学生ごとに分析する際に、第一成分として「総合成績」を、第二成分として「理経科目」「文系科目」を設定する。

因子分析

因子分析とは、多変量解析の一つで、あるデータが複数のグループに分類されている場合、新しいデータがどのグループに属するかを判断するための手法です。

例)設問数の多い顧客へのアンケート結果の相関性を分析して、「先進的な層」「保守的な層」
「どちらでもない層」の3グループに分け、新たなアンケート結果をグルーピングしていく。

クラスター分析

クラスター分析では、「雰囲気」や「価値観」「意識」といった定義しづらい特性でグルーピングして、示唆を得る分析手法です。グルーピングするだけなので、単独では示唆が得られない可能性もあり、「ロジスティック回帰分析」などと組み合わせて活用されるケースが多いです。

例)顧客へのアンケート結果をグルーピングして、複数の顧客像を作る。

コレスポンデンス分析

コレスポンデンス分析とは、クロス集計表をグラフ化して可視化することです。なお、クロス集計とは、2つ以上の質問項目の回答内容をかけ合わせることで、回答者の属性ごとの傾向がわかるようにした集計方法のことです。

コレスポンデンス分析で作成したグラフでは、関係性の強い要素同士は近くに、逆に、関係性の弱い要素同士は遠くに配置されます。
コレスポンデンス分析によって、クロス集計表の解釈がしやすくなります。

例)自社を含む業界の競合他社のブランドイメージや価格帯、品質の高さなどをクロス集計し、コレスポンデンス分析してブランドのポジショニングを行う。

重回帰分析を行う際の注意点

最後に、重回帰分析を行う際の3つの注意点をご紹介いたします。

適切な分析方法を選択する

ここまでにも何度かお伝えしてきたように、分析手法にはさまざまな種類があり、必ずしも重回帰分析が、求める答えを提供してくれるとは限りません。

重回帰分析が向いているのは、説明変数が複数あるケースで、目的変数への影響度合いを調べたり、将来の予測を行ったりしたい場合です。
各分析手法の特徴を押さえて、分析で得たい示唆を得られる手法を選びましょう。

全ての質的データを数値化する

変数として使いたいデータの中には、数値化されていない質的データもあるでしょう。
重回帰分析を行うには、すべての要素を数値化する必要があります。
たとえば、「あり・なし」を「1・0」、「大・中・小」を「3・2・1」や「100・50・0」などと表すことが可能です。

説明変数は厳選する

重回帰分析に使用する説明変数があまり多いと、式が複雑になる上に目的変数に対する影響度の低い説明変数が混ざってしまうため、精度の低いものとなってしまいます。
目的変数と関連性が低そうな説明変数は省くことが大切です。

3.データを収集し、解析する」でお伝えしたように、最適な説明変数の数は、重回帰分析に利用できるサンプルデータ数÷15までだといわれています。説明変数は厳選し、「サンプルデータ数÷15」に収まる数にしましょう。

まとめ

重回帰分析を活用することで、まだデータを取得できていない時期に、目的変数の予測を立てることが可能になります。分析結果や予測値は、ビジネス戦略に活かせます。根拠となるデータを元にした予測値を出せるため、ステークスホルダーに対する説得力も高いでしょう。

ただし、求める予測値や示唆をすべて重回帰分析が解決してくれるとは限りません。ほかの多変量解析や、その他の分析手法など、さまざまな方法の特徴や向き・不向きを知り、適切な方法を選びましょう。

Concept Book

ローコード開発・業務プロセスのデジタル化で豊富な実績を持つintra-martが、お客様のビジネスにどのような効果をもたらすのか、特長や導入効果など製品コンセプトを詳しくご紹介しています。

Concept Book

お困りごとがありましたら、お気軽にご相談頂ければと思います。

お役立ち資料ダウンロード

8分でわかるイントラマート

intra-martのローコード開発

お役立ち資料