連載 論文を理解するための統計学【重回帰分析篇】・5【最終回】
問題のあるデータをチェックする
中山 和弘
1
1聖路加看護大学
pp.577-589
発行日 2008年12月15日
Published Date 2008/12/15
DOI https://doi.org/10.11477/mf.1681100348
- 有料閲覧
- 文献概要
- 1ページ目
- 参考文献
- サイト内被引用
判断を間違わせる変数のチェック
◆正規分布をチェックして問題のある変数を探す
今回で連載の最後になりました。これまで述べてきた重回帰分析の見方も,それに適した問題のないデータを前提にしていなければ,結論を誤ってしまいます。問題のある変数,ケース,欠損値,サンプル数について説明したいと思います。まずは,問題のある変数からです。
重回帰分析を行なう場合には,用いられる変数についての前提条件または仮定(assumption)があります。それは,多変量正規分布または正規性(multivariate normal distributionまたはmultivariate normality)というものです。分析に用いているすべての変数が正規分布していて,さらにそれらでつくったあらゆる組み合わせの重回帰式での予測値も正規分布しているということです。何が何でも正規分布です。
これらは多くの多変量解析においてあてはまることで,そこでの統計的検定の前提条件になっています。もしその前提から大きく外れていると,検定で誤った結論を下す確率が高まります。外れていたとしても,ある程度までならば,頑健(robust;ロバスト)である,すなわち,前提条件から外れていても正しく有意であると判断できるともいわれます。しかし,多変量正規分布に近いほうが誤ることがないのは確かなので,確認しておいたほうがいいでしょう。そのときに効果的なのが残差の分析です。
Copyright © 2008, Igaku-Shoin Ltd. All rights reserved.