AIの耳にノイズキャンセリングの穴があったら？：2025/09/10

スマホのイヤホンに「ノイズキャンセリング」ってありますよね。普通の雑音ならカットしてくれます。

でも、ある特定の高さの音や、わずかな音程のズレだと、なぜかスッとすり抜けて聞こえてしまうことがある。

AIにも、これとよく似た“聞き間違いの帯域”があるかもしれない──それが今回紹介する研究の発見です。

Embedding Poisoning: Bypassing Safety Alignment via Embedding Semantic Shift

AIは危ない質問に対しては「答えません」と返すように訓練されています。これはちょうど、ノイズキャンセリングが雑音を消すのと同じ様な働きをします。

でもAIが文字を読むときは、実は「文字列」をそのまま見ているのではなく、一度数字の音波のようなものに変換して処理しています。

研究者は「危険な単語」の数字の波をほんのわずかに上下させてみました。

すると、普通なら「危ないから答えません」と跳ね返すはずの質問が、一部の音程のズレだけスルリと通ってしまうことがわかったのです。

見た目の文章は同じ。でもAIの内部では「危ない音が少し違う高さに聞こえてしまう」。その結果、フィルタが反応しない帯域に入り込み、有害な答えを返してしまうわけです。

研究では、次のような本来なら拒否されるべき質問が使われました。

6種類の公開モデルで試したところ、平均で96%もすり抜けに成功したとのこと。

つまり、ほとんどのケースで「ノイズキャンセリングの穴」を突けてしまったということです。

普段私たちがAPI経由でAIに質問するときは、文字列しか送れません。内部の数字（音波データのようなもの）に触ることはできないので、普通の利用者がこの攻撃をすることはできません。

実際に可能なのは

といったケースです。つまり、ふつうにAPIを使う人には心配ないけれど、供給元や配布ルートが改ざんされるリスクは残っている、という話です。

書き手

名前：Shindy Miyata

所属：SHARE Security

セキュリティエンジニア