今月の特集 知っておきたい がんゲノム医療用語集
解析(バイオインフォマティクス)に関する用語
谷嶋 成樹
1
1三菱スペース・ソフトウエア株式会社関西事業部バイオメディカルインフォマティクス開発部
キーワード:
ベースコール
,
マッピング/アライメント
,
変異コール
,
アノテーション
,
キュレーション
,
FASTQ形式
,
SAM/BAM形式
,
エラー率
,
quality score
,
read depth
,
coverage
,
SNV
,
SNP
,
VUS
,
CNV
,
CNA
,
データベース
,
CIViC
,
ClinVar
,
COSMIC
,
LOH
,
マイクロサテライト不安定性
,
mutation rate
,
somatic UPD
Keyword:
ベースコール
,
マッピング/アライメント
,
変異コール
,
アノテーション
,
キュレーション
,
FASTQ形式
,
SAM/BAM形式
,
エラー率
,
quality score
,
read depth
,
coverage
,
SNV
,
SNP
,
VUS
,
CNV
,
CNA
,
データベース
,
CIViC
,
ClinVar
,
COSMIC
,
LOH
,
マイクロサテライト不安定性
,
mutation rate
,
somatic UPD
pp.940-949
発行日 2019年8月15日
Published Date 2019/8/15
DOI https://doi.org/10.11477/mf.1542202108
- 有料閲覧
- 文献概要
- 1ページ目
- 参考文献
ベースコール,マッピング/アライメント,変異コール
■ベースコール(basecall)
DNAシークエンサーでは,解析対象のDNA配列に塩基の種類ごとに異なる蛍光物質を結合させ,蛍光の波長と強度により塩基を読み取る.例えば,SBS(sequencing by synthesis)法1)として知られる次世代シークエンサーの塩基決定手法では,一度に数十万〜数億個のDNA断片の塩基配列を読み取ることができる.これらは蛍光強度を示す数値として記録される.一般的に生データ(raw data)と呼ばれるのはこの形式のデータである.
ここからDNA変異などの解析を行うためには,蛍光強度データをアデニン(adenine:A),チミン(thymine:T),グアニン(guanine:G),シトシン(cytosine:C)のDNA配列データに変換しなければならない.このような,生データからDNA配列データへの変換プロセスをベースコールと称する.一般的に,ベースコールされたデータはFASTQと呼ばれるテキスト形式で保存される.ベースコールに使用するソフトウエアはシークエンスメーカーから提供されることが多い.
Copyright © 2019, Igaku-Shoin Ltd. All rights reserved.