- 有料閲覧
- 文献概要
- 1ページ目
- 参考文献
はじめに
概念分析とテキストマイニングという言葉から何を連想するだろうか。人工知能技術が発達したのだから,概念分析をテキストマイニングにより自動で行うことができると想像しただろうか。いずれはそのような未来が来るかもしれないが,残念ながら,本稿を書いている時点では,そこまではできない。では,テキストマイニングにより概念分析の「何を」「どこまで」できるのだろうか。本稿では,このような視点から述べてみたいと思う。
まずは,概念分析について,その手順をおさらいしておこう。概念分析の手順は,Walker, & Avant(2005/中木,川﨑訳,2008,5章)によると以下の8つである。
1.概念を選択する
2.分析のねらい,あるいは目的を決定する
3.選択した概念について発見したすべての用法を明らかにする
4.選択した概念を定義づける属性を明らかにする
5.モデル例を明らかにする
6.境界例,関連例,相反例,考案例,そして誤用例を明らかにする
7.先行要件と結果を明らかにする
8.経験的指示対象empirical referentを明らかにする
このうち,1と2は分析者の判断の範疇である。したがって,テキストマイニングの出番はないと思われる。もちろん,1から8の手順は反復されるため,以降の手順におけるテキストマイニングの結果により,例えば2の分析のねらいが修正されるかもしれない。
3は,概念の用法を可能な限り発見する段階である。これは,辞書や文献,同僚などの協力者を対象に行われる,とされている。特に文献調査では,近年広く普及しているオンラインデータベースを利用して文献を収集することになる。Walker, & Avant(2005/中木,川﨑訳,2008)によると,検索対象は看護や医療の文献に限定せず,概念の真の性質を理解できるよう多くの文献を調査することになる。したがって,この段階では,対象のデータベースの検索条件を適切に与え,対象とする概念を含む可能な限り多くの文献を入手する必要がある。また,多くの文献が入手できたと仮定すると,各文献のどこに対象とする概念が記述されているかを調査しなくてはならない。電子的に文献を収集できるならば,そのデータを利用して,テキストマイニングにより,対象とする概念の用法を抽出することが可能である。
4の概念を定義づける属性を明らかにする手順は,抽出した用法から概念の特徴を抽出していく作業である。まず,当該概念とともに頻出する属性を列挙していくことになるが,ここではテキストマイニングにより,当該概念を示す語と“ともに頻出する語”を列挙することができる。さらに,概念を含む前後の文を抽出することも容易である。属性は単なる「語」ではないため,列挙した概念を含む文や段落など,周辺を注意深く読む際に役立つ。概念を含む文の周辺をどの程度読み込むべきかは,分析者が決定する必要がある。
5のモデル例を明らかにする手順では,手順3や4を実施する過程で発見された例を利用できるかもしれない。この場合はテキストマイニングが役に立つことになる。適切なものが発見されなかった場合には,分析者が構築する必要がある。
6の補足例を明らかにする手順でも,手順5と同様に,適切なものがテキストマイニングにより発見されていなければ,分析者が構築する必要がある。
7と8の先行要件と結果,経験的指示対象を明らかにする手順では,テキストマイニングの出番はほぼないかもしれない。これらの段階では,分析者により,これ以前のテキストマイニングの結果によって抽出された語とそれを含む文書の集合から,適切な語やフレーズを選択したり,適切な表現を生み出したりする必要があるだろう。
以上のように,概念分析におけるテキストマイニングの役割は,主に収集された膨大な文献から調査・分析したい概念を表す“語”などを探し出す支援をするものである,ということができる。
Copyright © 2022, Igaku-Shoin Ltd. All rights reserved.