AIセーフティに関するレッドチーミング手法ガイド(第1.10版)の公開

AIセーフティ・インスティテュートは、2024年9月に公開した「AIセーフティに関するレッドチーミング手法ガイド」について、具体的な実施例を通してより詳細に理解できるよう改訂し、第1.10版として公開しましたのでお知らせします。RAG(Retrieval-Augmented Generation)の仕組みを実装したAIシステムに対して実際にレッドチーミングを行い、その手順を詳細に解説するとともに、レッドチーミング実施の成果物を文書としてとりまとめました。

J-AISI announces the publication of Version 1.10 of the “Guide to Red Teaming Methodology on AI Safety,” originally released in September 2024. This revised guide offers deeper insights and a more detailed understanding through practical examples. Specifically, we conducted red teaming on an AI system that implements a Retrieval-Augmented Generation (RAG) mechanism, explained each step in detail, and compiled the outcomes of the red teaming exercise into a structured document.