連載 外科医のためのビッグデータ利活用入門
第9回 欠測データの取り扱いと多重補完
遠藤 英樹
1
,
山本 博之
2
,
隈丸 拓
2
H. Endo
1
,
H. Yamamoto
2
,
H. Kumamaru
2
1慶應義塾大学医療政策・管理学講座/東京大学医療品質評価学講座
2東京大学医療品質評価学講座
キーワード:
欠測
,
欠測メカニズム
,
欠測値補完
,
多重補完
Keyword:
欠測
,
欠測メカニズム
,
欠測値補完
,
多重補完
pp.540-545
発行日 2024年7月1日
Published Date 2024/7/1
DOI https://doi.org/10.15106/j_kyobu77_540
- 有料閲覧
- 文献概要
- 1ページ目
- 参考文献
ビッグデータに限らずデータを扱う際に避けて通れないのが,データの欠測の問題である.欠測とは,解析項目の数値がなんらかの理由で存在しない状態のことをさす.自施設のみでの症例集団の解析で,みたい項目が欠測しており困ったことはないであろうか.論文を読んでいるとデータが欠測している症例をどのように扱ったかの記載がないことも多く,習慣的に欠測に関してうやむやにしたまま解析が行われることもある.欠測が引き起こす問題を誰にも指摘されずに論文として出版されることもあるであろう.気をつけなければいけないのは,多くの統計ソフトあるいはパッケージでは,欠測のある症例はなんの警告もなく除外されて解析処理されてしまう点である.これに気がつかないと,バイアスのある解析結果で誤った推論をしてしまう可能性がある.
© Nankodo Co., Ltd., 2024