グーグルのレッドチームが解説する、AIに対する攻撃手法4つ

今回は「グーグルのレッドチームが解説する、AIに対する攻撃手法4つ」についてご紹介します。

関連ワード (セキュリティ等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 新たなテクノロジーが普及すると必ず、それをハッキングしようとする人間が出てくる。人工知能(AI)、特に生成型AIもその例外ではない。この問題に立ち向かうために、Googleはおよそ1年半前にAI専任の「レッドチーム」を立ち上げ、AIを攻撃目標に据えたハッキング手法について調査することにした。

 同チームを率いるDaniel Fabian氏はThe Registerとのインタビューで「現実世界において、機械学習(ML)システムに狙いを定めている敵対者に関する脅威情報はそれほど多くない」と述べた。同氏のチームは既に、今日のAIシステムにおける最大級の脆弱性について指摘している。

 Fabian氏の説明によると、MLシステムに対する最大級の脅威には敵対的攻撃や、データポイズニング攻撃、プロンプトインジェクション攻撃、バックドア攻撃などがあるという。こうしたMLシステムには「ChatGPT」や、Googleの「Bard」、「Bing」で用いられているAIといった大規模言語モデル(LLM)が含まれている。

 この種の攻撃は一般的に「Tactics(戦略)」「Techniques(技術)」「Procedures(手順)」の頭文字を取った「TTP」という言葉で語られている。

 Fabian氏はThe Registerに「われわれは、敵対者のように考えられる人材を求めている」と述べるとともに、「われわれはMLの世界において、現実世界の敵対者が次に狙うところを予測しようと力を注いでいる」と述べた。

 GoogleのAIレッドチームは最近、AIシステムを標的とする攻撃者らが多用しているTTPについて概説するレポートを公開した。

 敵対的攻撃には、MLモデルのミスリードを目的として入力を記述するという行為も含まれている。これにより誤った出力や、他の状況では目にすることのない出力が、そういった出力を避けるよう別途モデルを訓練している場合であっても生成される。

 GoogleのAIレッドチームのレポートには「敵対的攻撃が成功した場合の影響は、ごくわずかなものから致命的なものまでさまざまであり、AI classifier(AIによるテキストや音声の分類器)のユースケースに強く依存する」と記されている。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
中国で知る人ぞ知る雑用代行サービス「UUパオトゥイ」が好評な理由
IT関連
2023-12-09 19:35
Perplexity、「DeepSeek-R1」を提供–サーバーを西側に配置も検閲は残存
IT関連
2025-02-01 01:24
「ROCK IN JAPAN」開催中止 県医師会などの要請に「何をもって万全とするのか」
くらテク
2021-07-08 07:18
「鬼滅の刃 DX日輪刀 〜我妻善逸〜」7月発売 ヘタレ善逸モード搭載で「助けてくれよ炭治郎」
くらテク
2021-04-29 06:45
AIが狙われている–インターネットに潜む次なる脅威
IT関連
2023-03-09 23:29
5年保存できるポテチ、湖池屋が開発した理由
くらテク
2021-07-28 06:44
2021年、誰もが「15分間の富(名声ではなく)」を得る
その他
2021-02-04 20:15
アップルがiPhoneやiPad、Watch向けにゼロデイ脆弱性に対するセキュリティアップデートをリリース
セキュリティ
2021-03-29 05:23
マイクロソフト、法執行機関からのデータ開示要請が増加–半期レポート
IT関連
2021-04-20 12:49
「マネーフォワード クラウド契約」、「案件管理オプション」提供–契約業務を一元管理
IT関連
2023-07-20 11:54
「マカフィーのSASEはDLPが強み」–「MVISION UCE」と「MIVISION XDR」を機能拡充
IT関連
2021-03-04 14:17
アカマイ、APIに潜むリスクを可視化する「API Security」をアピール
IT関連
2023-09-30 07:33
「うんこ交通安全ドリル」登場 交通安全協会推薦 スマホで学べるWebサイトも
くらテク
2021-04-07 12:00
2022年のWeb3トレンドを振り返る
IT関連
2022-12-29 16:52