グーグルのレッドチームが解説する、AIに対する攻撃手法4つ

今回は「グーグルのレッドチームが解説する、AIに対する攻撃手法4つ」についてご紹介します。

関連ワード (セキュリティ等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 新たなテクノロジーが普及すると必ず、それをハッキングしようとする人間が出てくる。人工知能(AI)、特に生成型AIもその例外ではない。この問題に立ち向かうために、Googleはおよそ1年半前にAI専任の「レッドチーム」を立ち上げ、AIを攻撃目標に据えたハッキング手法について調査することにした。

 同チームを率いるDaniel Fabian氏はThe Registerとのインタビューで「現実世界において、機械学習(ML)システムに狙いを定めている敵対者に関する脅威情報はそれほど多くない」と述べた。同氏のチームは既に、今日のAIシステムにおける最大級の脆弱性について指摘している。

 Fabian氏の説明によると、MLシステムに対する最大級の脅威には敵対的攻撃や、データポイズニング攻撃、プロンプトインジェクション攻撃、バックドア攻撃などがあるという。こうしたMLシステムには「ChatGPT」や、Googleの「Bard」、「Bing」で用いられているAIといった大規模言語モデル(LLM)が含まれている。

 この種の攻撃は一般的に「Tactics(戦略)」「Techniques(技術)」「Procedures(手順)」の頭文字を取った「TTP」という言葉で語られている。

 Fabian氏はThe Registerに「われわれは、敵対者のように考えられる人材を求めている」と述べるとともに、「われわれはMLの世界において、現実世界の敵対者が次に狙うところを予測しようと力を注いでいる」と述べた。

 GoogleのAIレッドチームは最近、AIシステムを標的とする攻撃者らが多用しているTTPについて概説するレポートを公開した。

 敵対的攻撃には、MLモデルのミスリードを目的として入力を記述するという行為も含まれている。これにより誤った出力や、他の状況では目にすることのない出力が、そういった出力を避けるよう別途モデルを訓練している場合であっても生成される。

 GoogleのAIレッドチームのレポートには「敵対的攻撃が成功した場合の影響は、ごくわずかなものから致命的なものまでさまざまであり、AI classifier(AIによるテキストや音声の分類器)のユースケースに強く依存する」と記されている。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
Twitterがインド最大与党のアカウントを停止
IT関連
2021-08-14 23:40
クリップで机に固定できる電源タップ、エレコムが発売 「テレワークにも」
くらテク
2021-07-21 22:06
SSH接続を設定ファイルで容易にするには
IT関連
2022-05-13 02:30
「ゴルゴ13」ギネス世界記録に 「最も発行巻数が多い単一漫画シリーズ」として
くらテク
2021-07-10 05:50
「ヘッドレス」eコマースプラットフォームFabricが早くもシリーズAで約45億円調達
ネットサービス
2021-02-11 00:52
密漁防止にドローン活用 AIで識別 赤外線カメラも
ロボット・AI
2021-05-18 07:19
Joby Aviationが空飛ぶタクシー乗降場所として立体駐車場に注目
モビリティ
2021-06-04 19:35
数十年前のASCIIアドベンチャーゲーム「NetHack」への挑戦から見えるAIの未来
人工知能・AI
2021-06-20 17:04
店舗オペレーション管理ツール「V-Manage」が多言語対応–日々のタスクを自動翻訳
IT関連
2023-11-15 18:34
ロシアへの輸出など順次停止–日立、ウクライナ危機下の対応説明
IT関連
2022-03-12 18:09
「Fedora Linux」でファイル共有を有効にするには
IT関連
2023-04-21 00:42
契約管理「LegalForceキャビネ」、期限通知時期のカスタマイズ機能をアップデート
IT関連
2023-03-18 20:08
ユーザベース、郵便物を自社でクラウド管理–郵便物対応だけの出社を約70%削減
IT関連
2022-08-04 01:30
ポケモンGO、米国などでポケストップを回せる距離をコロナ禍前の仕様に戻す 反対署名14万件を無視と波紋
くらテク
2021-08-04 18:42