AI News JAPAN

世界の最新AIニュースを毎朝配信(24時間以内)

Mistral、文書解析OCR新版「OCR 4」公開——日本語含む170言語対応、自己ホスティングも可能

30秒サマリー

  • 仏Mistral AIが文書解析OCRの新版「OCR 4」を公開、バウンディングボックスや信頼度スコアも出力
  • 日本語を含む170言語に対応し、単一コンテナでの完全自己ホスティングが可能
  • RAGや企業内検索パイプラインへの組み込みも想定、API料金は1000ページ4ドルから

何が起きたか

フランスのAI企業Mistral AIは2026年6月23日(現地時間)、文書解析OCRモデルの新版「Mistral OCR 4」を公開した。PDF・DOC・PPT・OpenDocumentなど主要な文書形式に対応し、テキスト抽出に加えて、各要素の位置を示すバウンディングボックス、見出し・表組・数式・署名などのブロック種別分類、ページ単位および単語単位の信頼度スコアを構造化JSONで返す。Mistral自身によれば、バウンディングボックスはユーザーから最も要望が多かった機能だという。

API経由での提供に加え、Mistral Studio、Amazon SageMaker、Microsoft Foundryからも利用できる。Snowflakeの「Parse Document」への対応も近く予定されている。単一コンテナで動作するため、自社インフラでの完全な自己ホスティングが可能であり、文書データを外部に送出せずに処理できるとしている。

対応言語は日本語を含む170言語。同社は、独立した評価者による人手の比較評価で主要なOCR・文書AIシステムすべてに対して勝率平均72%を達成したと主張している。ただし利用された公開ベンチマーク(OlmOCRBench:85.20、OmniDocBench:93.07)には採点上の既知の限界があるとして、スコアは「方向性を示すもの」と位置付けている。

料金はAPI経由で1000ページあたり4ドル(バッチAPIは同2ドル)。構造化JSON出力等を加えた「Document AI」は同5ドル。また同社のオープンソース検索フレームワーク「Mistral Search Toolkit」(パブリックプレビュー)の取り込みコンポーネントとしても利用可能で、RAGや企業内検索パイプラインへの統合が想定されている。同社は、医療診断・法的判断・重大な金融意思決定などへの利用は想定外と明示している。

原典ハイライト

Mistral AIの公式発表によれば、OCR 4は「文書の内容」だけでなく「各要素の位置・役割・モデルの確信度」まで構造化して出力できる点を最大の特徴として強調。バウンディングボックスが最多要望機能だったとも述べており、エンタープライズ用途での精度検証ニーズへの対応姿勢が読み取れる。

出典: ITmedia AI+(報道)

So What?(なぜ重要か)

OCRが「テキスト抽出ツール」から「文書構造の理解エンジン」へ進化しつつあることを示す動きだ。位置情報・ブロック種別・信頼度スコアの同時出力は、RAGパイプラインにおける検索精度向上や、契約書・帳票の自動処理における品質管理に直結する。加えて自己ホスティング対応は、クラウド経由での文書送出に制約を持つ組織がAI活用を進める上でのハードルを下げる可能性がある。

日本企業への示唆

日本企業にとっての注目点は二つある。第一に、日本語対応の精度と自己ホスティングの組み合わせは、機密性の高い社内文書(契約書・稟議書・図面など)をクラウドに送出せずにRAG構築できる選択肢として検討に値する。特にデータ主権・個人情報保護の観点からクラウドOCRサービスの利用をためらってきた金融・医療・製造業での活用可能性がある。第二に、信頼度スコアの出力は「AIの誤読をどう検知するか」という現場課題に応えるもので、人間によるレビュー工程の効率化設計に活用できる。ただし同社自身が医療・法的・重要金融判断への利用を不適切と明示している点は、用途設計時に留意が必要だ。

背景・経緯

Mistral AIは2025年3月にOCRモデルの初代版を公開しており、当初はMarkdown形式での出力・API料金は1000ページ1ドルだった。今回のOCR 4はその後継版にあたり、出力形式の大幅な拡張と料金改定(4ドル)が行われている。Mistralはフランスを拠点とするAIスタートアップで、オープンソースモデルの公開や企業向けAPIサービスで欧州系AI企業として存在感を高めている。