Japanese
English
特集 創薬ゲノミクス・創薬プロテオミクス・創薬インフォマティクス
第2部 総説
Ⅲ 創薬インフォマティクス
文献データベースからの生医学インフォマティクス
Biomedical informatics from bibliographic databases
武田 浩一
1
,
浦本 直彦
1
,
松澤 裕史
1
,
猪口 明博
1
,
村上 明子
1
Koichi Takeda
1
,
Naohiko Uramoto
1
,
Hirofumi Matsuzawa
1
,
Akihiro Inokuchi
1
,
Akiko Murakami
1
1日本アイ・ビー・エム株式会社東京基礎研究所
pp.443-448
発行日 2003年10月15日
Published Date 2003/10/15
DOI https://doi.org/10.11477/mf.2425100784
- 有料閲覧
- Abstract 文献概要
- 1ページ目 Look Inside
- 参考文献 Reference
大量文書からの知識発見を目指すテキストマイニングの手法は,構造化されていない文字列として表現されたテキストから,単語,固有表現(遺伝子,タンパク質の名称など),係受け(「Aが+Bを+抑制する」といった関係など)といった多様なレベルの情報抽出と,それらの要素間の統計的な分析によるパターンや傾向の発見を可能にした。ライフサイエンス分野では,約1,200万件の論文アブストラクトおよび書誌データを含むMEDLINE文献データベースや,同分野に現れる概念と用語を体系化したUMLSというシソーラスが広く利用可能であるため,近年になってテキスト情報に基づくインフォマティクスの中心的課題として非常に研究が盛んになってきた。
本稿では,このようなライフサイエンス分野におけるテキストマイニングの研究動向を,特に情報抽出技術を中心として概説するとともに,著者らの研究する特徴語分析,傾向分析,相関分析といったマイニング手法とそれを統合したシステムについて述べる。
Copyright © 2003, THE ICHIRO KANEHARA FOUNDATION. All rights reserved.