Japanese
English
- 有料閲覧
- Abstract 文献概要
- 1ページ目 Look Inside
- 参考文献 Reference
Ⅰ.はじめに
ビッグデータという言葉をテレビなどでも頻繁に耳に入るようになり,また,一般向けに書かれた統計学を扱った書物が多く出版されており,「ビッグデータブーム」あるいは「統計ブーム」とでもいうような状況になりつつある.この背景には,各種オミックスデータや電子カルテデータ,医学以外ではPOS(point of sale)システムによる購買ログデータやWebログデータなど,これまで考えられなかったような膨大なデータが比較的安価に測定可能となっており,それらの情報を科学研究などに有効に活用するために,計算機科学や統計学に大いに期待がかけられていることがあるように思われる.
ビッグデータの興隆以前から医学研究と統計学とは密接な関連があり,統計的方法は医学研究に広く用いられてきた.医学研究は多くの場合,厳しい倫理的および実施上の制限の下で研究を実施せざるを得ず,個体差による変動や不確実性を前提とした上で科学的推論を行う必要がある.このために統計学が用いられている.
「統計学」と聞くと,どのようなことをイメージするであろうか.国勢調査などの社会調査を思い浮かべる方もいるかもしれないが,現在,医学研究で多用されているのは推測統計学と呼ばれる方法で,20世紀初頭にR.A. Fisher卿などにより創始された,比較的新しい方法論である.推測統計学は,確率論と結びつくことで,不確実性に伴う変動を確率の言葉で定量化し,背後にある母集団の構造を推測するという立場をとる.医学論文で頻繁にみかけるP値や信頼区間は,推測統計学の概念である.
『New England Journal of Medicine』に掲載された各論文で用いられている統計手法の実態調査のアップデートによると,1980年頃は最も基本的と考えられるt検定が中心であったが,その割合が減少してきている13).この背景には,新たな方法が導入され,実際の臨床研究に適用されてきており,それを実行できる統計学の専門家が臨床研究に多く参画している現状があると考えられる.
一方で,最も影響力の大きい統計関連の団体である米国統計協会が最近,P値の誤用に関する声明を発表し16),それに続くように『Nature』や『New England Journal of Medicine』にも関連する論説が掲載された1,8).高度な統計手法の適用により,医学研究の可能性が広がってきているものの,高度化とともに基本に立ち返った適切な適用が求められている.
このような背景の下,本稿では,Ⅱ章で推測統計学の主要な道具である統計的仮説検定と信頼区間の考え方をできるだけ平易に説明する.また,医学研究で広範に用いられるロジスティック回帰とCox比例ハザードモデルの導入を行う.これらは言わば古典的な統計手法だが,20世紀末からの個別化医療の推進に伴い,それまでとは考え方を大きく異にした統計手法が開発されてきている.そのすべてに言及することは不可能だが,Ⅲ章で最近のいくつかの発展について解説する.
Copyright © 2020, Igaku-Shoin Ltd. All rights reserved.