Japanese
English
- 有料閲覧
- Abstract 文献概要
- 1ページ目 Look Inside
はじめに
今回は判別分析ということで議論を進めてみたい.今までは,原因の変数,結果の変数に注目して解析の手法を特定してきたが,今回は「判別する」,「診断する」,「判断する」ことを統計学的に処理する観点でどうのような手法があるか考察する.しかし,ここでは非常に興味のある手法を除くこととする.それはエキスパートシステムによる「診断」法である.この手法は,システム作成において主観が入ることが否めないし,作成したシステムについて評価を行ってはじめて客観性をもつという性格があると言えるからである.また,その数学的構造もこれから述べる手法と異なっていることも除外する理由である.
医学研究において,この疾患はこのような酵素活性が有意に上昇するといった知見が重要になる.疾患という群とその群に属すものに特有に見られる測定値の上昇(あるいは下降)という情報が集まれば,逆に,それらの測定値からこれはどの群に属すか判断できる.これが,判別分析という統計手法の問題意識である.したがって,データとしては,それが属す群が何かという情報と,それが持つ測定値の情報である.測定値の代わりに性質を表す情報でもよい.つまり,群を表すカテゴリカルな情報と,それが持つ連続的な(あるいはカテゴリカルな)1種類以上の情報ということになる.
さて,判別分析の統計学的アイデアに2通りのものがあると言っておこう.
その1つは,測定値が多次元正規分布などの確率分布に従うことを仮定し,確率的に外れが少ない判断をすべきであるとするものである.これは次節に詳述する.
もう1つは,各群についての測定値や,性質のデータを使ってscoreを作成する(数学的にはこれらの変数の線型結合―一次式―).このscoreの値によってどの群に属しているかを判断しようとするものである.同じ群に属すもののscoreは同じような値にするという考えに従っている.これについては次々節に詳述する.
Copyright © 2000, Igaku-Shoin Ltd. All rights reserved.