「AIサイエンティスト」： AIが自ら研究する時代へ

August 13, 2024

Sakana AIは、自然から着想を得たアプローチで最先端の基盤モデルを進化させるという分野を切り開いてきました。今年の3月には、大規模言語モデル（LLM)を含む複数の基盤モデルの統合を自動化する方法を開発し、さらに6月には、LLMを使って、LLMをより効率的にトレーニングする方法を発見しました。

The AI Scientist

そして今回我々は、「LLMを使って、研究開発プロセスそのものの自動化する」という革新的な技術を開発しました。我々は、これを「The AI Scientist」（AIサイエンティスト）と命名し、オックスフォード大学とブリティッシュ・コロンビア大学との共同研究により、「The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery」という論文にまとめて公開しました。ソースコードもオープンソース化しています。

The AI Scientistは、アイデア創出、実験の実行と結果の要約、論文の執筆及びピアレビューといった科学研究のサイクルを自動的に遂行する新たなAIシステムです。

最初の実証実験として、The AI Scientistは、LLM（大規模言語モデル）を活用して機械学習の研究に取り組みました。下記画像は実際に「The AI Scientist」が生成した機械学習研究論文の例です。

The AI Scientistが実際に作成した論文の例（「Adaptive Dual-Scale Denoising」）はこちらで見ることができます。

特筆すべき点は、最初の準備以外、一切人間の介入なしで、このシステムが機械学習研究の全ライフサイクルを自律的に実行できるということです。研究アイデアの発案、実験の設計・実施、結果の収集と分析までを自動で行い、その結果をもとに研究論文を執筆します。

さらに、論文執筆を担当するLLMとは別に、査読者役のLLMが生成された原稿を批評し、フィードバックを提供して研究を改善する他、次のサイクルでさらに発展させるべき有望なアイデアの選定も行います。これにより人間の科学コミュニティを模倣した継続的かつオープンエンドな探求のサイクルが実現します。今回の実証実験では、The AI Scientistは言語モデル、拡散モデル、Grokkingといった機械学習の研究分野で新たな貢献を行う様々な論文を生成しました。

手順

ここで、The AI Scientistが動作する実際の手順について説明します。

まず、作業は研究の方向性についての「ブレインストーミング」に始まります。探求してもらいたい既存のトピックの開始コード「テンプレート」を提供すると、研究の方向性を自由に探求することができます。アイデアが斬新であることを確認するために、学術文献を検索することが可能です。
アイデアとテンプレートが与えられると、次は実験の反復です。提案された実験を実行し、その結果を視覚化するプロットを取得して作成します。保存された図と実験メモなど、論文作成に必要な情報を用意します。
その後、標準的な機械学習会議のスタイルに基づいて論文を執筆します。学術文献を検索し、引用すべき関連論文を自律的に見つけます。
さらに、今回の成果の重要な点は、生成された論文を人間に近い精度で査読・評価ができる、LLMを用いた自動レビュアーの開発にあります。継続的なフィードバック・ループを実現し、研究成果を反復的に改善することが可能です。

ジョークが現実に

AIの大きな進歩のたびに、AI分野の研究者たちは「あとはAIに論文を書かせる方法を見つけるだけだ！」と冗談を言い合うのが常でした。我々の研究は、かつてジョークだったものが今、現実的なものとなったことを示しています。

The AI Scientistが実際に作成した論文の例（「Adaptive Dual-Scale Denoising」）はこちらで見ることができます。いくつかの欠点（例えば、最も関連性の高い実験だけでなく、実施したすべての実験を共有していること、成功した理由の解釈が若干間違っていること）はあるものの、この論文は興味深い新しい方向性を提案し、良い実験結果を示しています。このアイデアの有望性は、The AI Scientist自身が実験を行い、査読を行うことで実証されています。

そもそも、人工知能の分野においては、エージェントの開発（それによって科学的研究を行い、新しい知識を発見させる）が大きな目標の一つになっています。フロンティア・モデルを初めとするこれまでの類似の取組みにおいては、アイディアのブレインストーミングやコードの記述などで人間を介在させることが不可避でした。しかし今回我々が提唱する方法は、人間の代わりにLLMが独立して研究を行うことで人間の介在を排除した完全な自動化を達成しました。

破格のコスト

The AI Scientistはコストの点でも極めて効率的に設計されており、今回の実証実験では、各アイデアが実装され論文となる過程には1本あたり約15ドル（2300円）のコストしかかかりませんでした。

科学の新時代の扉を開く

The AI Scientistは科学研究の姿を変える潜在力を秘めています。自動化された科学的発見プロセスが繰り返されることで、アイディアがオープンエンドな形で反復的に開発され、知識が蓄積されていくことで、人間の科学コミュニティを模倣することができます。

また、このシステムがこれまでに示している将来性とこのコストの低さは、研究を民主化し、科学の進歩を大幅に加速する可能性を示していると考えます。

日本ではAI研究に携わる人材の不足が指摘されてきました。The AI Scientistを活用すれば同じ人員で生産性を何百倍にも高められる可能性があります。The AI Scientistの誕生は、人材不足が指摘されてきた日本のAI研究の競争力強化につながると確信しています。Sakana AIはThe AI Scientistの普及を通じ、日本の研究開発促進に貢献したいと考えています。

より詳細については、英文ブログをご覧ください。

Sakana AI

AIがAIを進化させる未来をSakana AIと一緒に切り拓いてくださる方を募集しています。当社の募集要項をご覧ください。

＜参考：The AI Scientistが生成した研究論文の例＞

今回の実証実験では、The AI Scientistは、言語モデル、拡散モデル、Grokkingといった機械学習の研究分野で新たな貢献を行う様々な論文を生成しました。

Diffusion Modeling

DualScale Diffusion: Adaptive Feature Balancing for Low-Dimensional Generative Models
Link to Full PDF Link to Code

Language Modeling

StyleFusion: Adaptive Multi-style Generation in Character-Level Language Models
Link to Full PDF Link to Code

Adaptive Learning Rates for Transformers via Q-Learning
Link to Full PDF Link to Code

Grokking

Unlocking Grokking: A Comparative Study of Weight Initialization Strategies in Transformer Models
Link to Full PDF Link to Code