2026年6月30日に、AnthropicがClaude Fable 5の提供を再開し、同時に新たな安全対策強化方針を公表した。また同日、OpenAIが、計算生物学領域のAIエージェント評価ベンチマークとして、GeneBench-Proを発表した。2026年7月1日には、国連の「AIに関する独立国際科学パネル」より、AIの能力・機会・リスクを評価した、初の世界的な独立科学報告書として、「予備報告書」が公表された。
AI情報通:7月2日15時の情報
AI評価と安全な展開をめぐる動向
-
Anthropic "Redeploying Fable 5"
Anthropicは、米政府による輸出規制の解除を受けて、最新モデル「Claude Fable 5」の提供を再開すると発表した。
また、Fable 5のセーフガードを回避できる手法が報告された経緯を踏まえ、サイバー攻撃等への悪用を防ぐため、以下の安全対策強化方針を示している。- 報告された回避手法を、99%以上のケースでブロックするよう、安全分類器を再学習させて改善したこと。
- 不審な利用パターンがないか、継続的に分析・監視すること。
- AmazonやMicrosoft等と共同で、AIのジェイルブレイク(脱獄)リスクの深刻度を評価する共通基準を構築すること。
このように、モデルの性能向上に伴って、求められる安全対策も厳格化しており、AIの安全性確保は、一企業単独の取り組みではなく、企業間や政府と連携の重要性が高まりつつあることが示された。
[リンク]
Anthropic. “Redeploying Fable 5”, June 30, 2026
https://www.anthropic.com/news/redeploying-fable-5 -
OpenAI "Introducing GeneBench-Pro"
OpenAIは、計算生物学の分析課題を通じて、AIエージェントが曖昧なデータから適切な判断を下す一連の能力を測定するベンチマーク「GeneBench-Pro」を発表した。
この、“GeneBench-Pro“は、遺伝学等の10分野にわたる129問で構成され、未整理データの探索、適切な分析手法の選択、中間生成物の見直し、最終アウトプットの導出まで、一連の複雑な判断プロセスを、評価する設計になっている。
本ベンチマークは、複雑で不確実性を伴う現実的な分析課題に対するAIの総合的判断能力を評価する新たな試みとして位置づけられる。[リンク]
OpenAI. "Introducing GeneBench-Pro." June 30, 2026.
https://openai.com/index/introducing-genebench-pro -
United Nations "Preliminary Report of the Independent International Scientific Panel on AI"
国連の、「AIに関する独立国際科学パネル」は、AIの能力・機会・リスクを評価した初の世界的な独立科学報告書として「予備報告書」を公表した。
本報告書は、AI科学の進歩と軌跡/科学、医療、教育、農業などへの社会的応用/経済的影響/セキュリティ、システム、環境への影響/人権、情報、民主主義への影響/文化と個人の繁栄、自律性、子どもの安全/AIの管理、ガバナンス、信頼性という、7つの主要領域にわたって知見をまとめている。
また、現行のセーフガードがAIの進化に追いついていない可能性を指摘し、政策立案には科学的根拠が必要である一方、根拠が明確になった時点では手遅れになりかねないという、意思決定上の難しさも指摘している。[リンク]
UN. "Preliminary Report of the Independent International Scientific Panel on AI", July 1, 2026.
https://www.un.org/independent-international-scientific-panel-ai/en/preliminary-report
その他のAI関連情報
-
Microsoft Security Blog "Securing AI agents: When AI tools move from reading to acting"(2026-06-30)
AIエージェントが外部ツールを自律的に操作する際に生じる、メタデータを改ざんしてAIを操る新たなサイバー攻撃について解説した。金融業務を例に、AIエージェントに意図しない情報送信や操作を実行させる攻撃手法を紹介。その対策として、利用するツールの事前審査、AIへの指示内容の監視、データ持ち出しのブロック(DLP)など、防御策のポイントを整理している
https://www.microsoft.com/en-us/security/blog/2026/06/30/securing-ai-agents-ai-tools-move-from-reading-acting/
免責事項
本ページは、AIセーフティに関する情報提供を目的として作成しています。
掲載内容については、作成時点において正確性、完全性および最新性の確保に努めていますが、これらを保証するものではありません。なお、本ページから参照する外部ウェブサイトやリンク先の内容については、作成時点から変更されている場合があります。また、外部ウェブサイトやリンク先の内容は、各ウェブサイトの運営主体により管理されており、当機構がその正確性、完全性、最新性又は安全性を保証するものではありません。
本ページに記載された内容は、政府としての公式見解を示すものではありません。
本ページに記載されている情報により生じる損失又は損害に対して、いかなる場合においても責任を負いかねます。
