AI News JAPAN

世界の最新AIニュースを毎朝配信(24時間以内)

MSがAIエージェント向け長期記憶システム「Memora」を発表、トークン使用量98%削減

30秒サマリー

  • MicrosoftがICML 2026で発表した記憶システム「Memora」は、AIエージェントの長期タスク処理能力を大幅に向上させる
  • 「何を蓄積するか」と「どう検索するか」を分離する設計で、既存手法を上回る精度をトークン消費量98%削減で達成
  • コードはオープンソースで公開済み、将来は組織知識の蓄積や複数エージェント間での知識共有も視野に入れる

何が起きたか

Microsoft Researchは2026年6月、AIエージェント向けの長期記憶システム「Memora」を、機械学習の国際会議ICML 2026において発表した。コードはGitHub上でオープンソースとして公開されている。

現在のAIエージェントは実質的に「状態を持たない」設計であり、セッションをまたいだ情報の保持が困難だ。Memoraはこの課題に対し、「記憶に何を格納するか(リッチなコンテンツ)」と「どのように検索するか(軽量な抽象表現)」を切り離すアーキテクチャを採用している。各記憶エントリは、6〜8語の短い「主抽象表現(primary abstraction)」と、詳細情報を保持する「記憶値(memory value)」の2要素で構成される。類似検索には主抽象表現のみが使用されるため、同一トピックの新情報は既存エントリに統合され、断片化を防ぐ。また「キューアンカー(cue anchors)」と呼ばれる文脈対応タグが、異なる切り口から同一記憶にアクセスする経路を提供する。

性能評価では、平均600ターンの対話データセット「LoCoMo」でLLM判定精度86.3%、11万5,000トークン規模の「LongMemEval」で87.4%を達成し、RAG・Mem0・Zep・LangMemおよび全コンテキスト参照(full-context inference)を上回る最高水準を記録した。特に多段階推論(マルチホップ推論)での性能向上が顕著とされている。トークン消費量は全コンテキスト参照比で最大98%削減、1会話あたりの記憶エントリ数もMem0の651件に対しMemoraは344件と約半数に抑えられている。

Microsoftは今後の研究方向として、記憶システムが自らの失敗から学習する「MemLoop」、記憶の生成タイミングを最適化する「Deferred Memory」、チームやエージェント間での知識共有を扱う「Group Memory」の3方向を挙げている。

原典ハイライト

原文ブログは「AIエージェントが数カ月・数年にわたって継続的にユーザーと協業し、組織知識を蓄積できるようにするための一歩」と位置づけている。LoCoMo・LongMemEval両ベンチマークで最高水準を達成しつつ、トークン使用量を最大98%削減した点が核心的な主張である。

出典: Microsoft Research Blog(公式ブログ)

So What?(なぜ重要か)

AIエージェントの「記憶のなさ」は、長期プロジェクトや複雑な業務への活用を妨げる根本的な制約だった。Memoraはその制約を、精度を落とさずに大幅なコスト削減で突破する設計を提示した。コードが公開されているため、自社システムへの組み込みや研究活用が即座に可能な状態にある。AI活用の戦場が「単発タスク」から「長期継続業務」へと移行しつつある中、記憶インフラの設計が競争優位の鍵になる可能性がある。

日本企業への示唆

プロジェクト管理・法務・研究開発など、数カ月単位で情報が積み上がる業務でAIエージェントを活用している企業は、Memoraの設計思想を参照する価値がある。特に「過去の議論の経緯や却下理由を記憶させたい」「複数のステークホルダーの意見を時系列で追跡させたい」といったユースケースに直接応える設計となっている。コードが公開されているため、自社の業務AIや社内ナレッジ管理システムへの実装検討が現実的な選択肢となる。また、将来的な「グループメモリ(チーム・組織単位での知識共有)」の方向性は、企業内AI基盤の設計に影響を与えうるため、AIシステム担当者は動向を注視すべきだろう。

背景・経緯

AIエージェントの長期記憶は近年の主要研究テーマとなっており、Mem0(アトミックな事実抽出)、RAG(テキスト断片の検索)、GraphRAGやZep(グラフ構造による記憶管理)などが先行して登場している。Memoraはこれらの手法が抱える「詳細保持と効率化のトレードオフ」を解決するものとして位置づけられている。論文はICML 2026に採択されており、Microsoft Research Lab(Cambridge・India・Redmond)の研究者が共同で開発した。