30秒サマリー
- AnthropicのClaude Opus 4.7が、四足歩行ロボットの操作タスクを人間チームの最大37倍の速度で単独完了
- 人間がモデルを補助する段階を経て、モデルが自律的に実行できる段階へ移行しつつあると分析
- ただし精密な物体操作など低レベル制御は未解決で、「物理的AIエージェント」の黎明期と位置づけ
何が起きたか
Anthropicのフロンティア・レッドチームは2026年6月18日、「Project Fetch フェーズ2」の結果を公式ブログで公表した。同実験は、市販の四足歩行ロボット(ロボット犬)をAIモデルが人間の補助なしに操作できるかを検証したものだ。
2025年8月のフェーズ1では、ロボット工学の専門家でないAnthropicの社員チームがClaude Opus 4.1の支援を受けて各種タスクに取り組み、Claudeを使えないチームを上回る成果を収めた。一方、モデル単独での完全自律実行はフェーズ1時点では不可能だった。今回のフェーズ2では、最新モデルのClaude Opus 4.7(最大effort設定・Claude Code使用)が同一タスク群を試行し、フェーズ1で少なくとも一方の人間チームが完了したすべてのタスクにおいて、最低でも10倍以上高速に完了した。両人間チームが完了した4タスクに限ると、平均でClaudeなしチームの37倍超、Claudeありチームの18倍超の速度だったとAnthropicは報告している。
なお、今回の実験で研究者が担った役割は、ラップトップをロボットに接続し、初期プロンプトを入力し、コマンドと次タスクへの移行を承認することに限定された。Opus 4.7は生成したコードの多くを初回から有効なものとして動作させ、人間チームの約10分の1のコード量で同等以上の成果を達成したという。
一方で課題も明確に示された。ビーチボールをホームベースに自律的に押し戻す「フェッチ」タスクでは、精密な位置制御が求められるため、Opus 4.7はうまく対応できなかった。より深いロボット工学の知識を持つ研究者が追加のスキャフォールディング(補助的な枠組み)を提供することで自律フェッチの実現は可能とみられると原文は述べており、現世代モデルでも条件次第で達成できると示唆している。
原典ハイライト
原文は「モデルはまずヒトを助け、次にヒトがモデルを助け、最終的にモデルがおおむね自力でできるようになる」という進化パターンをサイバーセキュリティ分野に続きロボティクスでも確認したと指摘。また「このロボット能力の向上は、ロボティクス特化の取り組みではなく、より汎用的なスケーリングから生まれた」と明記しており、特定領域への集中投資なしに物理制御能力が創発している点が核心。
出典: Anthropic Research(公式ブログ)
So What?(なぜ重要か)
AIが汎用LLMとして「物理的なアクター」へ近づきつつあるフェーズに入ったことを、Anthropicの公式実験が示している。これは産業用ロボットや物流ロボットなど実世界のハードウェアを組み合わせる際の要件を根本から変えうる変化だ。コード生成や情報処理に限られていたLLMの価値が、物理オペレーションの自動化へ直接接続する可能性が高まっており、AIロボット投資の判断サイクルを短縮する必要がある。
日本企業への示唆
日本企業、特に製造・物流・建設分野でロボット導入を検討する経営者にとって、以下の点が重要だ。第一に、市販の汎用ロボットとLLMを組み合わせるだけで、以前はエンジニアチームが必要だった作業が短期間で自動化できる可能性が高まっている。自社PoC(概念実証)のハードルが下がったと見るべきだろう。第二に、精密動作制御(ビーチボールの誘導など閉ループ制御)はまだ未解決であり、高精度が求められる工程への適用は現時点で限定的と判断するのが妥当だ。第三に、Anthropicが「ソフトウェアツールの次はハードウェア」という軌道を示唆している以上、AIロボット活用のロードマップを1〜2年単位で見直すサイクルを設けることが求められる。特にロボット工学の専門知識がなくても試せる環境が整いつつある点は、中堅・中小企業にとっても参入機会として無視できない。
背景・経緯
フェーズ1(2025年8月)はAnthropicの非専門家社員を対象に、Claude Opus 4.1あり・なしの2チームで同一ロボットタスクを競わせた実験。当時はClaude単独での完全実行は不可能だった。今回のフェーズ2は、約1年未満でモデルが人間チームを大幅に上回ったことを確認するフォローアップ実験として実施された。なお原文では、本実験がロボット能力の意図的な強化ではなく汎用スケーリングの副産物であると強調されている。

