文書ファイルなどに「目に見えないプロンプト(指示文)」を埋め込み、大規模言語モデル(LLM)の誤動作を狙う「間接プロンプトインジェクション攻撃」への警戒が高まっている。LLMが備える防御機能「ガードレール」は攻撃を防げるのか、検証した。
相次ぐサイバー攻撃。その端緒となることが多いのが、ソフトウエアの脆弱性(セキュリティー上の欠陥)である。脆弱性が見つかって公開されると、攻撃者は脆弱性を突くプログラム(エクスプロイト)を作成し、攻撃を仕掛ける。