ChatGPT Images 2.0が登場——「考えて描く」AIで画像生成が次のステージへ、中国Kimi K2.6は300エージェント並列で世界トップ水準、AIが単独で査読論文を執筆・採択される歴史的事例も

コラム
4月21〜22日、AI業界で3つの大きなニュースが重なりました。OpenAIが「思考しながら描く」新世代の画像生成モデル「ChatGPT Images 2.0」を発表。中国のMoonshot AIは、300体のサブエージェントを並列稼働させてコーディングの世界最高水準を塗り替えるオープンソースモデル「Kimi K2.6」をリリース。そしてSakana AIの「AI Scientist v2」が、AIが単独で執筆した論文を査読付き学術ワークショップで採択させるという歴史的な出来事が報告されました。

① ChatGPT Images 2.0——「考えながら描く」画像生成の新時代

OpenAIは4月21日、新しい画像生成モデル「ChatGPT Images 2.0」を発表しました。最大の特徴は「Thinkingモード」の搭載です。単に指示通りに画像を生成するだけでなく、プロンプトを深く解釈し、Web検索を行い、複数のバリエーションを自己評価しながら最適な出力を選ぶ推論プロセスを経て画像を生成します。

技術的な進化も顕著です。テキスト描画の精度は99%超を達成し、日本語・韓国語・ヒンディー語・ベンガル語など非ラテン文字の正確な描画にも対応。最大2K解像度での出力、3:1〜1:3の柔軟なアスペクト比、1プロンプトで最大8枚の同時生成が可能になりました。複雑な構図でオブジェクトが重なり合う場面での精度も大幅に改善されています。

利用形態はInstant(即時生成)とThinking(推論型)の2モードで提供。InstantはすべてのChatGPTユーザーが使用可能、Thinkingモードは有料プランのみとなっています。雑誌レイアウトのようなデザイン制作物や、日本語テキストを含む精密な画像生成が大幅に現実的になりました。

② Kimi K2.6——300エージェント並列で世界トップ水準のオープンソースモデル

中国のMoonshot AIは4月21日、最新オープンソースモデル「Kimi K2.6」をリリースしました。最大の注目点はエージェント群(スウォーム)のスケール感です。300体のサブエージェントが並列で稼働し、4,000ステップにわたる協調作業を実行できます。コーディングの継続実行時間は最長13時間に達し、長期にわたる複雑なソフトウェア開発タスクを自律的に完遂できます。

性能面ではコーディングベンチマーク「SWE-Bench Pro」で58.6点を記録し、GPT-5.4(57.7点)やClaude Opus 4.6(53.4点)を上回る世界最高水準を達成。最難関テスト「Humanity’s Last Exam(HLE-Full)」でも54.0点でトップとなりました。

アーキテクチャはMoE(Mixture of Experts)構造で、総パラメータ数は1兆ながら推論時のアクティブパラメータは320億のみ。コンテキスト長は256K tokensで、MoonViT(4億パラメータ)による画像・動画入力もネイティブ対応。Modified MITライセンスでHugging Faceに重みが公開されており、商用利用も可能です。

③ AIが査読論文を単独執筆——Sakana AI「AI Scientist v2」が学術史に残る一歩

日本発のAI研究機関Sakana AIが開発した「AI Scientist v2」が、AIが単独で執筆した論文をICLR 2025のワークショップ(査読付き)で採択させることに成功しました。仮説立案・実験設計・データ解析・論文執筆のすべてをAIが自律的に行い、人間の査読者による評価で採択基準を超えた、初めての事例として記録されます。

AI Scientist v2の仕組みは「エージェント型ツリーサーチ」です。複数の研究アイデアを木構造で探索し、各ブランチで仮説→実験→評価→改善のサイクルを繰り返しながら、最も有望な研究方向を自律的に選択します。この成果はNatureにも掲載され、学術コミュニティに大きな波紋を広げています。

「AI研究者」が人間の研究者と同じ土俵に立ち始めたことで、研究機関・学術誌・資金提供者がどのようにAI生成論文と向き合うかという新たな問いが浮上しています。Natureは「研究機関・資金提供者・出版社が対応を迫られている」と警鐘を鳴らしています。

まとめ:AIが「創る」「働く」「研究する」能力を同時に拡張した一日

今日の3つのニュースは、AIの能力拡張が異なる領域で同時に進行していることを示しています。

  • ChatGPT Images 2.0:「生成」から「思考しながら生成」へ——画像AIが推論能力を獲得
  • Kimi K2.6:オープンソースが世界トップ水準に——300エージェント並列でソフトウェア開発を自律化
  • AI Scientist v2:AIが科学研究の主体に——査読を通過した完全AI執筆論文が歴史的前例に

「AIを道具として使う」段階から、「AIが自律的に思考・行動・発見する」段階へ。その移行が、一日の出来事の中に凝縮されていました。


参考情報:
Introducing ChatGPT Images 2.0 – OpenAI
ChatGPT’s new Images 2.0 model is surprisingly good at generating text – TechCrunch
Moonshot AI Releases Kimi K2.6 – MarkTechPost
The AI Scientist-v2: Workshop-Level Automated Scientific Discovery – arXiv
The AI Scientist: Towards Fully Automated AI Research, Now Published in Nature – Sakana AI

タイトルとURLをコピーしました