マイクロソフト、生成AIのリスク特定に役立つ「PyRIT」ツールを公開

今回は「マイクロソフト、生成AIのリスク特定に役立つ「PyRIT」ツールを公開」についてご紹介します。

関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 生成型の人工知能(AI)モデルは高度な機能を備えるが、虚偽の情報を生成してハルシネーション(幻覚)を起こしたり、悪意ある人物に悪用される恐れのある抜け穴があったりする事例が、数多く確認されている。Microsoftはこの問題の緩和を支援するため、生成AIシステムのリスクを特定するのに役立つツールを発表した。

 Microsoftは米国時間2月22日、「Python Risk Identification Toolkit for generative AI(PyRIT)」をリリースした。これは、MicrosoftのAI Red Teamが、「Copilot」を含む同社の生成AIシステム内のリスクを確認するために使用しているツールだ。

 Microsoftはこの1年間で、複数の高価値の生成AIシステムに対するレッドチーミングを行い、その経験を通して、それらのシステムのレッドチーミングが従来のAIやソフトウェアに対するものとは大きく異なることを学んだと、発表の中で述べた。

 異なる点の1つは、通常のセキュリティリスクに加えて、有害なコンテンツや偽情報の生成など、責任あるAIのリスクを考慮しなければならないことだという。

 また、生成AIモデルはアーキテクチャーがそれぞれ大きく異なり、同じ入力から生成できる結果にばらつきがあるため、すべてのモデルに適合する、合理化された1つのプロセスを見つけるのが難しい。

 その結果、それらのさまざまなリスクの1つ1つを手動で調べる作業が、退屈で時間のかかる、低速なプロセスになってしまう。Microsoftは、自動化がレッドチームに役立つとして、より注意が必要なリスクの高い部分を自動で特定し、定型的なタスクを自動化することができるとしている。そこで登場するのが、PyRITというわけだ。

 PyRITは、悪意のあるプロンプトを生成AIシステムに送信し、返ってきた応答を評価する。その評価に基づいてまた新たなプロンプトを送信するという。

 MicrosoftはPyRITの最大のメリットとして、作業効率が向上し、作業にかかる時間が大幅に短縮されることを挙げている。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
音楽からダンスを自動生成するAI振付師 Googleなど開発 :Innovative Tech
トップニュース
2021-02-18 12:47
京都のヤサカタクシーとNearMeが「攻めのDX」でタッグ、タクシー業界のDXと乗車客の快適な移動を目指し業務提携
モビリティ
2021-04-14 03:10
「Windows 10」次期機能アップデート「21H1」はどうなる?
IT関連
2021-03-18 13:52
NEC、国内企業で最大規模となるAI研究用スーパーコンピューターの構築を開始
IT関連
2022-05-20 04:11
日立GLS、家電の顧客体験管理にクアルトリクスを導入
IT関連
2024-07-18 04:15
Snowflake、マーケットプレイスの国内展開を本格化–国内7社がデータ提供に参画
IT関連
2022-10-26 19:21
SnapがARグラス「Spectacles」の新世代バージョンを発表
VR / AR / MR
2021-05-22 20:07
資生堂、ITファイナンス管理基盤を導入–戦略的なIT投資を強化
IT関連
2021-03-25 20:11
台湾TSMC、アリゾナ州に第2の半導体工場を建設へ–投資5.5兆円に
IT関連
2022-12-08 06:19
「GPT-4」を公開したOpenAI、詳細な技術情報は非公開
IT関連
2023-03-21 09:26
カプコン、クラウド型決算基盤を導入–月次決算業務を15営業日から7営業日に短縮
IT関連
2022-03-24 19:21
FPSの生みの親カーマック氏ら「DOOM」スタッフが移植した幻のPC版「スーパーマリオブラザーズ3」デモFDが発掘
ゲーム / eSports
2021-07-16 00:28
Windows 10サポート終了まで1年を切る–IPAが注意喚起
IT関連
2024-10-17 17:15
暖房機器のコロナ、ワークフローシステム導入で年8万枚の紙帳票を削減
IT関連
2023-11-03 07:15