Japanese
English
特集 整形外科領域におけるAIの応用
Ⅶ章.生成AIによる医療DX
1.大規模言語モデルの医師国家試験の解答解析
-――ChatGPTとGPT-4の比較から始まった大規模言語モデル研究の広がり
Answer analysis of large language models in the national medical licening examination
中原 龍一
1
R. Nakahara
1
1岡山大学整形外科
1Dept. of Orthop. Surg., Faculty of Medicine, Okayama University, Okayama
キーワード:
large language model
,
bag of heuristics
,
inverse knowledge search problem
Keyword:
large language model
,
bag of heuristics
,
inverse knowledge search problem
pp.644-648
発行日 2025年5月25日
Published Date 2025/5/25
DOI https://doi.org/10.15106/j_seikei76_644
- 有料閲覧
- Abstract 文献概要
- 1ページ目 Look Inside
- 参考文献 Reference
は じ め に
ChatGPTをはじめとする大規模言語モデル(large language model:LLM)は,本邦だけでなく世界中の医師国家試験で高い性能を発揮している.しかし,「LLMは問題を解けているようにみえても,実際には過去問を丸暗記しているだけではないか」という疑念が浮上し,LLMは丸暗記をしているわけではないが,人間の理解とは異なる理解をしている可能性が示唆された.さらにLLMは知識を覚えることはできても逆検索が苦手であることが明らかになり,LLMに不足している知識を伝える手法の研究もすすめられている.
このように医師国家試験研究は思わぬ広がりをみせており,LLM医療利用の問題を事前に検討する実験場として機能している.本稿では,医師国家試験を対象としたLLM研究の進展と周辺領域の広がりについて概説する.

© Nankodo Co., Ltd., 2025