
ユニバーシティ・カレッジ・ロンドン(UCL)の研究者による研究で、GPTなどの大規模言語モデル(LLM)は、人間の専門家を超える精度で神経科学研究の結果を予測できることが示されました。Nature Human Behaviour誌に掲載されたこの研究は、大規模なテキストデータセットで訓練された人工知能が、情報を抽出するだけでなく、パターンを特定して科学的成果を予測できることを実証しています。
科学予測への新たなアプローチ
本研究の筆頭著者であるケン・ロー博士(UCL心理学・言語科学科)によると、ChatGPTのような生成AIの開発は、一般化と知識抽出の大きな可能性を切り開いたという。しかし、研究者たちはAIの過去の情報を分析する能力を研究するのではなく、AIが将来の実験結果を予測できるかどうかを調査することにした。
「科学の進歩にはしばしば試行錯誤が伴い、時間とリソースを要します。経験豊富な研究者でさえ、文献の重要な詳細を見逃してしまうことがあります。私たちの研究は、LLMがパターンを検出し、実験結果を予測できることを示しています」とロー博士は述べています。
BrainBench: AIと専門家によるテスト
LLM の機能をテストするために、研究者は BrainBench と呼ばれるツールを作成しました。このツールには、神経科学からの科学的要約のペアが含まれています。
- 1 つの要約には実際の研究結果が含まれます。
- 2 つ目は、専門家によって作成された、修正されたもっともらしい結果です。
15の言語モデルと171人の神経科学専門家を対象に、本物と偽物の結果を区別する能力をテストしました。結果は驚くべきものでした。
- AIの平均精度は81%だったのに対し、専門家のスコアはわずか63%だった。
- 知識に関する自己評価が最も高い専門家でも、達成率はわずか 66% でした。
改善されたモデルと視点
研究者たちはオープンソースのLLM(Mistralのバージョン)も改良し、神経科学に関する科学文献で学習させた。その結果生まれたBrainGPTと呼ばれるモデルは、さらに高い精度(86%)を示した。
「私たちの研究は、AIが実験設計プロセスの不可欠な部分となり、作業をスピードアップするだけでなく、効率も高めることができることを示しています」とUCLのブラッドリー・ラブ教授は語った。
機会と課題
研究者たちは、このアプローチが様々な科学分野に応用できると示唆している。しかし、この研究結果は重要な疑問を提起する。現代の科学研究は果たして十分に革新的だろうか?AIの予測精度の高さは、多くの科学的発見が既存のパターンと整合していることを示唆している。
「私たちは、科学者が実験を計画し、起こりうる結果を予測し、反復を加速し、より多くの情報に基づいた決定を下すのに役立つAIツールを構築しています」とロー博士は付け加えた。
AI の活用におけるこの画期的な進歩により、科学的発見が加速し、世界中の研究の効率が向上することが期待されます。