マイクロソフト、AIのリスクを探るレッドチームによる5つの洞察を公開

今回は「マイクロソフト、AIのリスクを探るレッドチームによる5つの洞察を公開」についてご紹介します。

関連ワード (CIO/経営等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 この半年で、人工知能(AI)がもたらす好ましい影響がこれまで以上に注目されるようになったが、AIのリスクもまた同様だ。

 最悪の場合、AIは誤った情報を生み出し、有害または差別的なコンテンツを生成し、セキュリティやプライバシーのリスクをもたらす可能性がある。そのため、モデルを一般に公開する前に正確なテストを行うことが極めて重要であり、Microsoftは5年前からそれを実行している。

 同社は2018年にAIレッドチームを立ち上げた。同チームは、「攻撃者のように考え」「AIシステムの不具合を探る」ことによって、AIモデルのリスクを調査することを専門とする学際的な専門家で構成されているという。

 そしてMicrosoftはこのほど、責任あるAI導入の模範となるべく、レッドチームの活動と知見を公開した。同社によると、AIモデルをテストする上では、ベースモデルのレベルと、アプリケーションのレベルの双方の視点が欠かせないという。同社はその例として、「Bing Chat」のAIを「GPT-4」のレベルと、GPT-4を利用した実際の検索エクスペリエンスという双方の視点から監視していることを挙げている。

 Microsoftは同社ブログに「いずれのレベルにもそれぞれ固有のメリットがある。例えば、モデルをレッドチーム演習の攻撃対象にすること(レッドチーミング)は、プロセスの初期段階でモデルの悪用方法を洗い出したり、モデルの適用範囲を見極めたり、モデルの制約を理解する上で役立つ」と記している。

 同社は5年間の経験で培ってきた、AIのレッドチーミングに関する重要な5つの洞察を公開した。

 1つ目の洞察は、AIのレッドチームミングという言葉の適用範囲だ。AIのレッドチーミングとは、単にセキュリティをテストすることだけでなく、公平性や、有害なコンテンツの生成といった要素に関するテストを含む技術の総称だ。

 2つ目の洞察は、悪意を持ったペルソナと悪意のないペルソナのそれぞれが犯した失敗に着目する必要があるというものだ。レッドチーミングはたいていの場合、悪意を持ったアクターによるテクノロジーの利用方法に着目するが、平均的なユーザーが利用する際に有害コンテンツがどのように生成されるのかについてもテストする必要がある。

 Microsoftは、「新しい『Bing』において、AIのレッドチーミングは悪意ある敵対者がセキュリティにフォーカスしたテクニックやエクスプロイトを用いてAIシステムを悪用する方法だけでなく、システムと一般ユーザーがやり取りする際に、そのシステムが問題のある有害なコンテンツをどのように生成するのかについても焦点を当てる」と記している。

 3つ目の洞察は、AIシステムが常に進化し続けているため、さまざまなレベルでのAIシステムのレッドチーミングが必要になるというところにある。これにより4つ目の洞察が導き出される。それは、生成型AIシステムのレッドチーミングには複数にわたる試みが必要になるというものだ。

 生成型AIシステムとのやり取りは、そのたびに異なった出力が得られる傾向にある。このためMicrosoftは、システムの問題を見過ごしてしまわないようにするために、レッドチーミングによる多角的な試みを実行しなければならないという知見を得ている。

 最後に、MicrosoftはAIの問題を緩和するには、深層防御という考え方が必要になると記している。つまり、レッドチームが問題を洗い出した後、その問題に取り組むためのさまざまな技術的緩和策を導入することになる。

 同社が採っているような対策は、新たなAIシステムに対する懸念を和らげるのに役立つと同時に、それらのシステムに関連するリスクを軽減するのにも役立つはずだ。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
「GPT-4」を公開したOpenAI、詳細な技術情報は非公開
IT関連
2023-03-21 09:26
AIは歌手の敵か味方か AIシンガー開発者が語る未来 分身がいることが武器になる社会へ
くわしく
2021-01-30 23:30
NISTの耐量子計算機暗号標準に、IBM開発のアルゴリズムが採用
IT関連
2024-08-20 11:12
ミレニアル世代やZ世代を惹きつけたいインスタ風アプリSupernovaはSNS大手の「倫理的オルタナティブ」になれるか
IT関連
2022-01-18 08:48
Reddit、Twitterのように任意のNFTをプロフィール画像に設定できる機能をテスト中
IT関連
2022-01-28 09:19
ベネッセ、生成AIを活用した「次世代型コンタクトセンタープロジェクト」を開始
IT関連
2023-06-22 11:12
NECとNTT Com、製造現場における作業員の見守り実証–3Dマップとスマートグラス活用
IT関連
2023-08-05 02:11
ロボット遠隔制御サービスHATSを開発するキビテクが1.5億円調達、システム開発や実証実験推進・エンジニア採用強化
IT関連
2022-02-18 22:16
ロボット/自動化と小売業界の2021年–コロナ禍で加速する9つのトレンド
IT関連
2021-01-22 03:31
生成AIがローコード/ノーコード開発テクノロジーを補完し始めているとIDC Japanが指摘。国内ローコード/ノーコード開発テクノロジー市場予測
ローコード/ノーコード開発
2024-11-28 20:48
フリーランスITエンジニアの案件数が多い言語、1位Java、2位JavaScript、3位PHPなど。Go言語は人材不足。レバテックフリーランス調べ
プログラミング言語
2023-02-17 17:30
マイクロソフト、マルチクラウド対応の開発プラットフォーム「Radius」を発表
IT関連
2023-10-31 08:03
FCNTとArithmer、AIを活用した簡易型検品システムを開発–製造業のDXを推進
IT関連
2022-09-10 23:42
マクニカソリューションズ、不正な特権アクセスを検知するデータ分析基盤を提供
IT関連
2023-09-10 05:37