「AIシステムに対する既知の攻撃と影響」に関する更新
Updates on “Known Attacks and Their Impacts on AI Systems”

AIセーフティ・インスティテュートでは、AIシステムに対する特有のセキュリティ攻撃を俯瞰すべく、学術論文等で発表されたAIやAIシステムに対する攻撃とその影響を「AIシステムに対する既知の攻撃と影響」としてまとめています。
AIシステムに対する既知の攻撃と影響 Known Attacks and Their Impacts on AI Systems - Japan AISI

今回、直近の国際会議での論文の内容を踏まえ、第2版として資料を更新しました。
AIシステムに対する既知の攻撃と影響(第2版)[日本語]

本資料は、既に公開した「AIセーフティに関するレッドチーミング手法ガイド」に記載のAIシステムへの代表的な攻撃手法を補完し、本資料で示した攻撃とAIシステムへの影響の関係がレッドチーミングのリスクシナリオや攻撃シナリオの作成に活用できることに加えて、AIセキュリティに関する調査検討や研究開発にも参照頂けます。AIセーフティ・インスティテュートでは、AIの安全な活用を支援する活動に引き続き取り組んで参ります。

At the Japan AI Safety Institute, we have compiled a document titled “Known Attacks and Their Impacts on AI Systems,” which summarizes attacks on AI and AI systems—along with their consequences—published in academic papers and other sources, to provide an overview of security threats unique to AI systems.
Known Attacks and Their Impacts on AI Systems - Japan AISI

On this occasion, we have updated the document for the second edition based on the content of the paper presented at the recent international conference.
Known Attacks and Their Impacts on AI Systems (2nd Edition) [English]

This document supplements the representative attack methods described in our previously published “Guide to Red Teaming Methodology on AI Safety”. It clarifies the relationship between attacks and their impacts on AI systems, helping develop risk and attack scenarios. This document also serves as a reference for further investigation, evaluation, and research and development in AI security. The Japan AI Safety Institute will continue its efforts to support the safe and secure use of AI.