LLMのセキュリティ対策は「まだ道半ば」–Splunkの首席調査官が指摘

今回は「LLMのセキュリティ対策は「まだ道半ば」–Splunkの首席調査官が指摘」についてご紹介します。

関連ワード (セキュリティ等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 世界的に生成AIの活用が進む中、大規模言語モデル(LLM)とそのユーザーを保護するためのセキュリティ対策は「まだ道半ばの状態にある」――。こう語るのは、Splunkのグローバルセキュリティ調査チーム「SURGe(サージ)」で首席セキュリティストラテジストを務めるShannon Davis氏だ。

 SURGeチームは、サイバーセキュリティの分野で活躍する専門家たちで構成されており、新たに発生したセキュリティインシデントへの素早い対応や、セキュリティ上の問題への解決策を提供することを使命としている。特に影響範囲が広く、社会的な注目を集めるサイバーセキュリティインシデントにおいては、初動対応の技術や背景情報を提供し、最新のセキュリティトレンドを分析して研究を進め、その成果をブログやホワイトペーパー、ポッドキャストを通じて広く共有している。

 「LLMは複雑なシステムであり、従来のテクノロジーと同様に管理・保護が必要になる。この1年間、LLMベースのアプリケーションが悪用されたケースを目にしてきた」とDavis氏は語り、昨今のAI技術の急激な発展とLLMシステムの複雑性により、「セキュリティ面が十分に考慮されずに開発・導入されているLLMベースのアプリケーションが多く存在している」と指摘した。

 SURGeチームでは、LLMアプリケーションに対する脅威を定義するフレームワークとして、ウェブアプリケーションのセキュリティ向上を目的とした非営利団体、Open Web Application Security Project(OWASP)が提示した「OWASP Top 10 for Large Language Model Applications」を活用した。Davis氏は「LLMに関連する特定の脆弱性と脅威ベクターを理解することで、効果的な防御を実装できるようになる」と重要性を語る。

 Davis氏は、その上位10項目から「プロンプトインジェクション」「安全でない出力処理」「モデルへのサービス拒否(DoS)攻撃」「機密情報の開示」「モデルの盗難」の5つについて特徴と対策を説明した。

 「プロンプトインジェクション」は、意図した出力を変更するように設計された悪意のある入力を送り込むことでLLMを操作する。攻撃者がこれらの入力を作成する方法が多数あるため複雑さが生じ、単純な検出ルールを作成することは困難であるという。

 しかし、Splunkの機械学習と異常検出技術を活用することで、プロンプトインジェクション攻撃を示す異常なパターンを識別するモデルを構築できる、とDavis氏は話す。また、Protect AIなど、AIシステムのセキュリティと信頼性を確保するためのソリューションも有用だという。

 「安全でない出力処理」については、LLMを利用するユーザーおよびアプリケーションの両方に影響を及ぼす恐れがある。例えば、LLMのレスポンスに安全な処理が施されていない場合、クロスサイトスクリプティング(XSS)によってユーザーの環境で不正な操作が行われてしまう可能性がある。また、ユーザープロンプトも実行前に安全性をチェックする仕組みが実装されていなければ、SQLインジェクションなどによってバックエンドシステムが攻撃される恐れがある。

 LLMベースのアプリケーションには、基本的なウェブアプリケーションセキュリティを実装する必要がある、とDavis氏は指摘する。また、不正な侵入が見つかった場合にそれを検出できるようにしておく必要があるという。

 「モデルへのDoS攻撃」は、LLMモデルに対して非常に多くの計算リソースを消費させることで、サービス品質などを低下させる攻撃になる。

 これについて、Davis氏は「幾つかの標準的なテクニックで検出できる脅威である」と説明する。プロンプトとレスポンスのセッションごとのトークン使用量、トークンを消費したユーザー、トランザクションに関わる待ち時間をログに記録することで、システムを騙してリソースを大量に消費させようとする異常値を検出するのに役立てられるという。

 「機密情報の開示」は、LLMのレスポンスの中で機密情報などを開示してしまうことを悪用した攻撃になる。SURGeチームでは、Microsoftが作成した「Presidio」というツールを利用し、個人を特定できる情報(PII)を検出して匿名化した。

 「モデルの盗難」についてはまだ調査中であるとしつつも、この脅威についても基本的にはプロンプトとレスポンスの分析によって脆弱性を検出できるとしている。「現在の難点は、研究に十分な規模のデータセットを見つけることだ」(Davis氏)

 「生成AIの領域は、これまでにないほど急速に変化しているため、新たな脅威に遭遇することは間違いなく、それに対抗するための新たな防御策も登場するだろう。生成AIの特徴を十分に理解しないと、脆弱性を作ってしまう可能性がある。LLMベースのアプリケーションをより適切に保護するために(SURGeチームの情報を)役立ててほしい」(同氏)

COMMENTS


Recommended

TITLE
CATEGORY
DATE
5Gワゴン車で変える過疎地 Society 5.0社会の快適な暮らし
IT関連
2021-03-03 09:01
アステラス製薬、経営の高度化に向けて基幹システム刷新–アクセンチュアが支援
IT関連
2022-02-27 13:16
「人材」ではなく「人財」をうたう企業への“底知れぬ違和感”
IT関連
2023-04-25 01:21
KDDI、量子コンピューティング技術で東京・神奈川エリアの通信品質改善
IT関連
2022-03-20 04:02
国内製造業で観測されたウェブ攻撃全体の57%はAPIを対象–Akamai脅威レポート
IT関連
2024-04-09 02:30
EVサブスクのOntoが充電ステーションへのアクセス拡大でShellと提携
モビリティ
2021-03-12 19:37
【インタビュー】年初から話題のゲーム「Wordle」制作者が語る、バイラルでの人気とその先にあるもの
IT関連
2022-01-30 08:58
日立、戦略的なOSS活用をグローバルで推進する組織「OSPO」を設立
IT関連
2024-11-13 07:48
プログラミング言語「Rust」、2021年版のリリース予定が明らかに
IT関連
2021-05-17 20:00
「攻めのDX」の実現で注目される「Platform Engineering」とは
IT関連
2023-09-16 16:40
埼玉県、「exaBase 生成AI」を全職員に導入–独自ユースケースの創出へ
IT関連
2024-11-26 11:27
PCやスマホで建機・重機を遠隔操作できる「Model V」を東大発ARAVが提供開始、後付け装着で利用可能
モビリティ
2021-06-19 15:23
グーグルがインドで個人ローンアプリの悪用を受け多数削除、悪質な取り立てで自殺も
ネットサービス
2021-01-18 08:11
Cloudflare、すべての生成AIによるクローラーをワンクリックでブロックする機能を無料で提供開始
クラウド
2024-07-11 07:59