LLMマルチエージェントの「性格設計」、タスク種別で効果が逆転——arXiv論文

30秒サマリー

LLMエージェントに付与する「性格」がチーム成果に与える影響はタスク構造に強く依存することが判明
コーディング等の構造化タスクでは性格操作が成果にほぼ影響しないが、協調・交渉タスクでは大幅に低下
マルチエージェントシステム設計において、用途別の性格チューニングが必要との示唆

何が起きたか

アリゾナ州立大学のAryan Keluskarら3名は2026年6月25日、arXivにマルチエージェントLLMチームにおける「性格構成」の影響を検証した論文を公開した（arXiv:2606.27443）。

研究では、最先端LLMに対してBig Five性格特性のうち「協調性（agreeableness）」の高低をプロンプトで操作し、「構造化コーディング」「オープンエンドな研究協力」「競争的交渉」の3タスク領域でチーム成果を比較した。

結果として、コーディングタスクでは協調性が低いプロンプト設定によってエージェント間のコミュニケーションスタイルは大きく変化したものの、マイルストーン達成率への影響は軽微だった。一方、オープンエンドな協力タスクと交渉タスクでは、同じ操作によって成果が大幅に低下した。論文は20ページ・6図で構成されており、マルチエージェントシステム設計への示唆と性格操作の限界についても考察されている。

原典ハイライト

論文アブストラクトは「コーディングタスクでは協調性低下が大きなコミュニケーション変化をもたらすが、マイルストーン達成への影響は小さい。しかし協力・交渉タスクでは同じ操作が成果を大幅に低下させる」と明記。性格効果の有無はタスク構造に決定的に依存するとの結論を示している。

出典: arXiv cs.AI（論文）

So What?（なぜ重要か）

LLMエージェントへの「性格付与」は設計上の有力な手段だが、その効果はタスク種別によって正反対に作用しうることが実証された。「とりあえず協調的なエージェントを並べる」という画一的な設計が、交渉や協調を要む業務では逆効果になるリスクがある。マルチエージェントAIを業務導入する際は、タスク特性に応じた性格設計の検証が不可欠となる。

日本企業への示唆

日本企業がLLMマルチエージェントを業務自動化に導入する際、エージェントの「性格プロンプト」設計はタスク種別ごとに個別評価すべきである。例えば、コード生成・レビュー系の自動化であれば性格設定の影響は限定的とみられるが、社内稟議支援や取引交渉シミュレーション、複数部門をまたぐ協調タスクでは協調性設定が成果品質に直結する可能性がある。PoC（概念実証）段階でタスク種別ごとにベンチマークを設け、性格設計の是非を定量評価するプロセスを組み込むことが望ましい。

背景・経緯

近年、LLMエージェントに人間の性格特性を模したプロンプトを付与する手法が広まっている。先行研究では、協調性が低いプロンプトが対立的な言語を生み出し、高いプロンプトが協調的な応答を生むことは示されていたが、そうしたコミュニケーションスタイルの変化がタスク成果に結びつくかどうかは体系的に検証されていなかった。本論文はその空白を埋めることを目的としている。

AI News JAPAN