増刊号 メタボリックシンドローム健診検査技術マニュアル
各論
3. 検査後手順―検査結果の読み方と利用法 2) 健診支援システムの実例 (2) 健診領域に適用可能なデータ解析技術
片岡 浩巳
1
1高知大学医学部附属病院検査部
pp.1253-1259
発行日 2007年10月15日
Published Date 2007/10/15
DOI https://doi.org/10.11477/mf.1543101896
- 有料閲覧
- 文献概要
- 1ページ目
- 参考文献
はじめに
健診から得られたデータは,通常の病院で取り扱われる検査データと比較して,検査項目が限定され,欠損値が少なくデータ解析を行ううえでは比較的取り扱いやすい領域である.その一方で,問診などの多様なデータ形式を含むデータを取り扱う必要がある.また,多くは基準値内に収まるデータであり,これらの解析には微妙なパターンの違いから将来を予測するルールや,パターンの発見を行うことができる技術を利用する必要がある.
2008年度から開始される特定健診・特定保健指導制度に用いられる予定の階層化ルールは,受診者を,情報提供,動機づけ支援,積極的支援の三つのランクに分類し,早期に行動変容を起こさせる狙いがある.これらの分類を行うためのルールやカットオフ値は,各専門学会の意見や世界中の研究者のエビデンスを集約した,いわゆるエキスパートルール1)により判定されている.このようなエキスパートシステムは,人為的に作成されたルールを用いるが,これらのルールが正しいのか,また,もっと優れた検出ルールはないか,あるいは,どのような保健指導が効果的なのかなど,実際のデータを基にして解析する「データセントリックサイエンス」がこれからの研究を支える重要なキーワードである.
本稿では,健診から得られたデータを多次元的な視点で解析することを目的として,データマイニングの研究領域で利用される代表的な手法であるクラスタリング(clustering)とクラシフィケーション(classification)の実例と,一般的な統計手法である重回帰分析を用いた予測解析の事例を紹介する.
Copyright © 2007, Igaku-Shoin Ltd. All rights reserved.