- 有料閲覧
- 文献概要
- 1ページ目
- 参考文献
はじめに
1990年代後半,ヒトゲノムをはじめ,様々な生物種のゲノムの解読が進行するなか,細胞内の転写産物を網羅的に解析するための技術としてマイクロアレイ(microarray)が登場した.数千から数万個の遺伝子発現を同時に観察することができるため,細胞内の転写産物の総体,すなわちトランスクリプトーム(transcriptome)の解析が可能になったのである.
マイクロアレイの基本原理は,ゲノムスケールの,大規模なハイブリダイゼーションである.マイクロアレイはDNAチップとも呼ばれ,ガラススライドやシリコンの上にDNA分子を高密度に配置(アレイ;array)したものである.このDNA分子に,サンプル中のmRNAをハイブリダイズさせ,その強度から遺伝子発現を観察するというものである.
このマイクロアレイによる遺伝子発現情報の解析には,大きな特徴がある.それは,劣決定問題(underdetermined problem)であるということである.典型的な臨床研究では,数千から百万件の症例を用いて,高々数十から数百個の変数を説明するが,マイクロアレイによる遺伝子発現情報の解析では,高々数十件のサンプルを用いて,数千から数万個の変数を説明しようとするのである.このように,症例・サンプル数に対して,説明しようとする変数が多過ぎるため,観察された遺伝子発現を説明しうる多くの答えが導かれてしまうのである.
劣決定の性質をもつデータから,興味深い変数や変数間の関係を見いだすには,高次元のデータ(空間)を探索する機械学習(machine learning)の手法を用いるのがよい.機械学習の手法とは,例えば,音声や顔,指紋などの高次元のデータの自動認識で用いられており,具体的には,決定木,SVM(Support Vector Machine),ニューラルネットワークなどがある.
これらの機械学習の手法を用いることで,マイクロアレイの遺伝子発現情報とサンプルの臨床情報の高次データから,例えば,疾患を臨床的に意味のあるサブグループに分類することができる.これにより,適切な治療,投薬,予後予測の実現が期待されている.決定木やSVM,ニューラルネットワークにより,疾患群の遺伝子発現プロファイルの特徴を学習させ,実際の臨床検査に役立てようというわけである.しかし,現実には,マイクロアレイの実験はまだ高価であり,これを臨床で一般的に検査法として利用するのは医療経済的に困難であるが,発見しにくい癌の診断に用いるなど,近い将来,実現するだろう.
本稿では,こうしたマイクロアレイによる遺伝子発現情報の解析について,マイクロアレイ技術,正規化とフィルタリング,発現変動の有意性の検定,クラス識別,転写上流配列解析との統合と転写ネットワーク推定,CGHとタイリングアレイについて解説する.
Copyright © 2005, Igaku-Shoin Ltd. All rights reserved.