« アルファ係数 | トップページ | チキン味のカール »

2005年11月22日 (火)

重回帰分析の用語解説

重回帰分析を使いましたので、若干用語解説をしておきましょう。

重回帰分析は何かの変数(今日の分析では中国のイメージ)をいくつかの変数(テレビ視聴時間やネット利用時間など)で予測しようとする分析法です。予測に使う変数を説明変数(あるいは独立変数)といい、予測の標的となる変数を目的変数(あるいは従属変数)といいます。

目的変数をY、説明変数をX1、X2、などとして
  Y’=b1X1+b2X2+・・・
という式でYの予測値Y’を求めていきます。YとY’の差の二乗の合計がもっとも小さくなるようにb1やb2を求める方法を最小二乗法といいますが、このような方法で全体として誤差の少ない予測式を求めます。

このとき、実際の値Yと予測値Y’との相関係数を重相関係数Rといい、重相関係数Rの二乗を重決定係数R2(アールスクエア)といいます。重決定係数はYの変動のうち何%がX1やX2によって説明されるかを示す値で、モデル全体の説明力を表します。今日の分析で悪いイメージを目的変数としたときのR2が0.07となっていますが、これは人によって悪いイメージの個数が多かったり少なかったりする変動の7%が「テレビニュース視聴」と「ネット利用時間」という二つの要因で説明できる(残りの93%は他の要因で変動している)ことを示しています。7%というと少ないようですが、この手のアンケート調査による分析ではそこそこの説明力となります。

  Y’=b1X1+b2X2+・・・
のb1やb2にあたる係数を偏回帰係数といいます。YやX1やX2を平均0、分散1になるように変換する標準化という操作をしてから求めたb1やb2を標準偏回帰係数(あるいはベータ係数)といいます。これはX1やX2が1単位増えるとb1やb2の分だけY’が増えますので、それぞれの説明変数が目的変数に与える影響力の大きさを示す指標だと解釈することができます。先の分析では「テレビニュース視聴」のベータ係数が0.186、「ネット利用時間」のベータ係数は0.169となっていましたが、これはテレビニュース視聴の悪いイメージ形成に及ぼす影響力がネット利用時間の影響力よりやや大きいことを意味しています。

そんなわけで、重回帰分析の結果を見るときにはとりあえず重決定係数R2ベータ係数に注目するとよいでしょう。それぞれモデル全体の説明力と各説明変数の影響力を表しています。

|

« アルファ係数 | トップページ | チキン味のカール »

コメント

大変分かりやすかったです。
テスト前で、とても困って居たので助かりました!

投稿: 大学生 | 2011年1月19日 (水) 21時18分

あrがとうございます!

投稿: | 2013年11月29日 (金) 16時23分

重回帰分析の季節になりましたね。参考になれば幸いです。頑張ってください!

投稿: くじょう | 2013年12月 2日 (月) 11時53分

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/121873/7256425

この記事へのトラックバック一覧です: 重回帰分析の用語解説:

« アルファ係数 | トップページ | チキン味のカール »