マイクロソフト、生成AIのリスク特定に役立つ「PyRIT」ツールを公開

今回は「マイクロソフト、生成AIのリスク特定に役立つ「PyRIT」ツールを公開」についてご紹介します。

関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 生成型の人工知能(AI)モデルは高度な機能を備えるが、虚偽の情報を生成してハルシネーション(幻覚)を起こしたり、悪意ある人物に悪用される恐れのある抜け穴があったりする事例が、数多く確認されている。Microsoftはこの問題の緩和を支援するため、生成AIシステムのリスクを特定するのに役立つツールを発表した。

 Microsoftは米国時間2月22日、「Python Risk Identification Toolkit for generative AI(PyRIT)」をリリースした。これは、MicrosoftのAI Red Teamが、「Copilot」を含む同社の生成AIシステム内のリスクを確認するために使用しているツールだ。

 Microsoftはこの1年間で、複数の高価値の生成AIシステムに対するレッドチーミングを行い、その経験を通して、それらのシステムのレッドチーミングが従来のAIやソフトウェアに対するものとは大きく異なることを学んだと、発表の中で述べた。

 異なる点の1つは、通常のセキュリティリスクに加えて、有害なコンテンツや偽情報の生成など、責任あるAIのリスクを考慮しなければならないことだという。

 また、生成AIモデルはアーキテクチャーがそれぞれ大きく異なり、同じ入力から生成できる結果にばらつきがあるため、すべてのモデルに適合する、合理化された1つのプロセスを見つけるのが難しい。

 その結果、それらのさまざまなリスクの1つ1つを手動で調べる作業が、退屈で時間のかかる、低速なプロセスになってしまう。Microsoftは、自動化がレッドチームに役立つとして、より注意が必要なリスクの高い部分を自動で特定し、定型的なタスクを自動化することができるとしている。そこで登場するのが、PyRITというわけだ。

 PyRITは、悪意のあるプロンプトを生成AIシステムに送信し、返ってきた応答を評価する。その評価に基づいてまた新たなプロンプトを送信するという。

 MicrosoftはPyRITの最大のメリットとして、作業効率が向上し、作業にかかる時間が大幅に短縮されることを挙げている。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
ヤオコー、AI活用した自動発注システムを全店導入–日立製作所らと協創
IT関連
2023-02-23 10:35
NEC、地方自治体の行政窓口ソリューションを提供–手続きの効率化に寄与
IT関連
2023-08-03 06:39
Instagramはクリエイターの生活のためにアフィリエイトとショップ機能を導入
ネットサービス
2021-06-11 17:02
JavaScriptランタイム「Bun 1.1」正式リリース。Windows版登場、Node.jsとの互換性向上、前バージョンより高速化など
Bun
2024-04-03 22:26
TD シネックス、Chromeデバイスのライセンス管理ツールを無償公開
IT関連
2022-09-07 17:23
AIを活用した製薬会社向け商業インサイトプラットフォームのODAIAが約16億円を調達
IT関連
2022-02-12 02:32
グーグル、AI分野の2つの研究グループを統合–「Google DeepMind」を新設
IT関連
2023-04-22 01:56
米英豪政府のセキュリティ機関が共同で発表–悪用の多い脆弱性30件
IT関連
2021-07-31 02:24
ランサムウェアの要求に従うも、データが流出される事例が発生
IT関連
2022-08-27 03:42
欧米によるデータ移転の新たな枠組み進展、グーグルら期待
IT関連
2022-04-01 02:39
「Exchange Online」の先進認証への切り替え、10月までに–米CISAが要請
IT関連
2022-07-05 04:48
IBMとSAP、金融機関のハイブリッドクラウド導入を加速へ
IT関連
2021-07-30 09:05
クラウドコンピューティングの今後を考える–ハイブリッドやエッジからAIまで
IT関連
2023-03-28 11:35
EUが第三国へのデータ移転に関する最終ガイダンスを発表
パブリック / ダイバーシティ
2021-06-30 08:19