Anthropic史上最も賢いAIモデルが登場 🚀
100万文字を一度に記憶し、AIチームが並列で働き、事実上「無限の会話」を実現。
ソフトウェア業界の株価を揺るがした衝撃のアップデートを、中学生にも分かる言葉で徹底解説
前モデルOpus 4.5(2025年11月公開)からわずか3ヶ月でのアップデート。バージョン番号の差は小さいが、中身は大幅に進化している
「どれくらい深く考えるか」をAIが自分で判断する画期的な仕組み。 以前は「じっくり考える」か「すぐ答える」の二択しかなかったが、今回から4段階(Low / Medium / High / Max)で自動調整される。
たとえるなら、簡単な質問にはサッと即答し、難しい問題には時間をかけてじっくり考える「賢い判断力」を手に入れたということ。 初期設定はHigh(ほぼ常にじっくり考える)。開発者は用途に合わせて自由に切り替え可能。
Opus系モデルとして初めて100万単語分の情報を一度に記憶・処理できるようになった。 これは約75万語=本1,000ページ以上に相当する。
「長い文章の中から必要な情報を見つける力」を測る試験(MRCR v2)では76%を記録。 前モデルSonnet 4.5の18.5%と比べて約4倍の精度。 巨大なプログラムのコード全体や、数千ページの法律文書を丸ごと読んで理解できる。
複数のAIが「チーム」として同時に働く画期的な仕組み。 今までは1つのAIが順番にタスクをこなしていたが、今回からは役割分担して並列作業が可能に。
たとえるなら、1人のAIが「コードを書く担当」「テストする担当」「書類を整える担当」と分業し、 人間のエンジニアチームのように協力して作業を進められるようになった。 Anthropic製品責任者のScott White氏は「優秀なチームを丸ごと手に入れたようなもの」と表現。
事実上「無限の会話」を可能にする新技術。 会話が長くなって記憶の上限に近づくと、AIが自動的に古い会話を要約して容量を確保する。
以前は長い会話をすると途中で「記憶切れ」になっていたが、この機能により何時間でも連続して作業を続けられる。 特に長時間のプログラム作業や、複雑な調査作業で威力を発揮する。
一度に出力できる量が前モデルの64Kから128Kへ2倍に増加。 これにより、長いプログラムコードや詳細な報告書を「途中で切れる」ことなく一気に生成可能に。
より深く考えるための「思考用メモリ」も増えたため、複雑な問題への回答品質も向上。 大きな出力を要求する場合は、通信の途切れを防ぐため自動的に分割配信(ストリーミング)される。
Claude in PowerPointが新登場。PowerPointの中に直接AIが入り込み、 既存のフォント・色・レイアウトを読み取って、会社のデザインに合ったスライドを自動生成。
Excel統合も大幅強化。整理されていない「汚い」データの表計算ファイルでも、 AIが説明なしで内容を理解して処理できるようになった。 財務分析、法務文書、営業資料など、初回から実務レベルの品質で出力される。
AIの処理を実行する場所を国単位で指定できるようになった。 現在は「アメリカ国内のみ」で処理する選択肢が提供されている(料金は1.1倍の上乗せ)。
これは、政府機関や金融・医療などの機密データを扱う企業にとって重要な機能。 「自社のデータが他国のサーバーで処理されるリスク」を排除したい顧客への対応。 初期設定は「グローバル」(世界中のサーバーから最適な場所を選択)。
主要なテスト結果。数値はAnthropicが公開した評価基準による。他社モデルの数値もAnthropicの測定条件下のもの
| テスト名 | 測定内容 | Opus 4.6 | Opus 4.5 | GPT-5.2 |
|---|---|---|---|---|
| GDPval-AA | 💼 仕事で役立つ知識力(金融・法務等) | 1,606 Elo 🥇 首位 | 1,416 | 1,462 |
| Terminal-Bench 2.0 | 💻 自律的プログラム作成力 | 65.4% 🥇 首位 | 59.8% | 64.7% |
| ARC AGI 2 | 🧩 新しい問題を解く柔軟性 | 68.8% 🥇 首位 | 37.6% | 54.2% |
| BrowseComp | 🔍 見つけにくい情報をネットで探す力 | 最高スコア 🥇 首位 | ─ | ─ |
| Humanity's Last Exam | 🎓 超難問の総合推論力 | 最高スコア 🥇 首位 | ─ | ─ |
| BigLaw Bench | ⚖️ 法律文書の読解・推論力 | 90.2% 🥇 首位 | ─ | ─ |
| OSWorld | 🖥️ パソコン操作の自動化 | 72.7% 🥇 首位 | 66.3% | ─ |
| SWE-bench Verified | 🐛 バグ修正能力 | 80.8% | 80.9% ※微差 | ─ |
| OpenRCA | 🔧 システム障害の原因特定 | 34.9% | 26.9% | ─ |
⚠️ 数値はAnthropicが自社環境で測定した結果であり、各社が独自に公表する数値とは異なる場合がある
前モデルOpus 4.5と完全に同額を維持。性能が上がっても値上げなし
20万単語を超える長文入力は $10/100万単語
20万単語超のプロンプト時は $37.50/100万単語
データを米国内サーバーのみで処理したい場合
Opus 4.6の発表と、直前のCoworkプラグイン公開が引き金となり、ソフトウェア業界の株価が急落
4月以来最悪の2日連続下落を記録。ソフトウェア業界全体が売り圧力に。「AIが専門ソフトを置き換えるのでは」という恐怖が市場を支配
法務・金融の専門データを提供する大手。Claudeが法律文書の分析で90.2%という高得点を叩き出したことで、「専門サービスがAIに代替される」恐怖が直撃
オンライン法律サービス大手。Coworkの法務向けプラグイン(業界特化型AI)の登場により、存在価値そのものが問われる事態に
業界追跡型の上場投資信託(ETF)が1日で約6%下落(4月以来最悪)。約2,850億ドル(約42兆円)が市場から蒸発したと報道
性能向上と安全性を両立させるため、Anthropic史上最も広範な安全テストを実施
公式発表の表向きの説明と、業界の文脈から読み取れる本当の狙い
Anthropicの公式声明では、Opus 4.6は「プログラム作成から日常の仕事へと守備範囲を広げた」モデルと位置づけられている。 具体的にはコードを書く能力の向上、 100万単語の記憶力、 AIチームによる並列作業を通じて、 ソフトウェア開発者だけでなく、金融アナリスト、法務担当者、商品管理者など あらゆる知識労働者の生産性を高めることが目標と説明している。
❶ OpenAI対抗の緊急リリース
発表の20分後にOpenAIがGPT-5.3 Codexを公開した事実が示す通り、両社は激しい「AIの軍拡競争」のさなかにある。
Opus 4.5からわずか3ヶ月での更新は異例の速さで、市場シェアを奪われまいとする危機感の表れと見られている。
❷ 「ソフトウェアを置き換える」戦略
Cowork(1月公開)+業界別プラグイン+PowerPoint統合+Excel強化の組み合わせは、
単なるチャットAIではなく「既存のビジネスソフトの代替品」になるという宣言。
CNBCはこれを「バイブワーキング(Vibe Working)時代の到来」と表現。
Thomson Reutersが15%、LegalZoomが20%急落した事実が、市場がこの脅威を本気で受け止めている証拠。
❸ 法人顧客の囲い込み
Anthropicの売上の約80%は法人顧客(30万社以上の有料契約)。
データ処理地域の選択(米国限定処理)は、政府機関や規制産業の大口契約を獲得するための布石。
料金据え置きも「乗り換えるコストより、留まるメリットが大きい」状態を作る戦略と読める。
❹ 安全性アピールの真意
「歴代最も安全」という発表は技術的事実であると同時に、
規制当局へのアピールでもある。
AIの自律性が上がるほど、政府による規制の圧力は高まる。
先手を打って「我々は安全だ」と示すことで、規制を有利な方向に誘導する意図がある。
本レポートは以下の情報源に基づいて作成。複数ソースで照合済み
🔗 Anthropic公式発表(2026/2/5)
🔗 Claude API公式ドキュメント(2026/2/5)
🔗 Microsoft Azure公式ブログ(2026/2/6)
🔗 AWS公式発表(2026/2/6)
🔗 Google Cloud公式ブログ(2026/2/6)