連載 論文を理解するための統計学【重回帰分析篇】・4
説明変数を選んだり順番に入れたりする
中山 和弘
1
1聖路加看護大学
pp.493-505
発行日 2008年10月15日
Published Date 2008/10/15
DOI https://doi.org/10.11477/mf.1681100340
- 有料閲覧
- 文献概要
- 1ページ目
- サイト内被引用
説明変数を統計的な基準で選ぶときの仕組み
◆ステップワイズは使うべきではない?
分析のために用意した説明変数は,多重共線性がみられた場合はともかくとして,なるべくすべてについて関連を確認したいものです。しかし,要因としての可能性がある変数を徹底して収集した調査や既存の統計などの場合は,用意した変数があまりに多くなることがあります。そして,そのなかからなんとか関連のある変数を探し出す必要があります。まず単相関でスクリーニングするのも1つの方法ですが,前号で述べたように,抑制変数が存在することを考えると不安になります。
そのとき,よく用いられてきた代表的な方法はステップワイズ(stepwise)法です。これは,指定した統計学的な基準によって,変数を選択させる方法です。一定の関連のあるものだけを拾うように計算させるわけです。
しかし,このような統計的に変数を選択する方法に対しては,根強い反対意見があります。基本的にそれに賛成です。それでも,実際には,特に日本では,かなり普通に使われていることがあるようです。ここでは,それがなぜなのかを考えてみることにしましょう。それには,その仕組みをよく知っておく必要があります。自動的になんの疑いもなく,いちばん関連のあるよいものだけを簡単に探してくれていると思ったら間違いで,そこに落とし穴があります。
Copyright © 2008, Igaku-Shoin Ltd. All rights reserved.