マイクロソフト、生成AIのリスク特定に役立つ「PyRIT」ツールを公開

今回は「マイクロソフト、生成AIのリスク特定に役立つ「PyRIT」ツールを公開」についてご紹介します。

関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 生成型の人工知能(AI)モデルは高度な機能を備えるが、虚偽の情報を生成してハルシネーション(幻覚)を起こしたり、悪意ある人物に悪用される恐れのある抜け穴があったりする事例が、数多く確認されている。Microsoftはこの問題の緩和を支援するため、生成AIシステムのリスクを特定するのに役立つツールを発表した。

 Microsoftは米国時間2月22日、「Python Risk Identification Toolkit for generative AI(PyRIT)」をリリースした。これは、MicrosoftのAI Red Teamが、「Copilot」を含む同社の生成AIシステム内のリスクを確認するために使用しているツールだ。

 Microsoftはこの1年間で、複数の高価値の生成AIシステムに対するレッドチーミングを行い、その経験を通して、それらのシステムのレッドチーミングが従来のAIやソフトウェアに対するものとは大きく異なることを学んだと、発表の中で述べた。

 異なる点の1つは、通常のセキュリティリスクに加えて、有害なコンテンツや偽情報の生成など、責任あるAIのリスクを考慮しなければならないことだという。

 また、生成AIモデルはアーキテクチャーがそれぞれ大きく異なり、同じ入力から生成できる結果にばらつきがあるため、すべてのモデルに適合する、合理化された1つのプロセスを見つけるのが難しい。

 その結果、それらのさまざまなリスクの1つ1つを手動で調べる作業が、退屈で時間のかかる、低速なプロセスになってしまう。Microsoftは、自動化がレッドチームに役立つとして、より注意が必要なリスクの高い部分を自動で特定し、定型的なタスクを自動化することができるとしている。そこで登場するのが、PyRITというわけだ。

 PyRITは、悪意のあるプロンプトを生成AIシステムに送信し、返ってきた応答を評価する。その評価に基づいてまた新たなプロンプトを送信するという。

 MicrosoftはPyRITの最大のメリットとして、作業効率が向上し、作業にかかる時間が大幅に短縮されることを挙げている。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
Zoom、クラウドコンタクトセンターのFive9を約1兆6000億円で買収
企業・業界動向
2021-07-20 15:01
飲食店と卸売業者間の受発注サービス「クロスオーダー」を手がけるクロスマートが2.7億円を調達
フードテック
2021-02-23 18:26
知識と革新の中核担うスイス連邦工科大学–スピンオフ企業も続々
IT関連
2023-12-20 16:02
Google Cloudとメイヨークリニックが提携–生成AIによる医療業界の変革に向け
IT関連
2023-06-09 10:25
三井住友海上とあいおいニッセイ同和損保、クラウドERP採用–経費管理を効率化
IT関連
2022-08-09 04:29
考えたいビデオ会議の背景–印象を大きく左右、「空白」はプロ意識が低い?
IT関連
2021-01-18 20:21
センサーや電源などのユニットを組み合わせてIoTデバイスを開発できるハードウェア「PILEz」登場
企業・業界動向
2021-05-29 05:19
生成系AIとは–注目を集める背景や問題点
IT関連
2023-02-23 20:29
九州電力送配電、発電側課金計算システムに「RISE with SAP」を採用
IT関連
2024-07-25 05:49
グアムにある車を2500km先の東京から遠隔操作 ソニー・ドコモが5G活用の実証実験
企業・業界動向
2021-03-24 01:57
「Microsoft Teams」、主催者がチャットを無効にできる機能を追加
IT関連
2021-02-19 14:50
テックタッチ、企業向け生成AI活用プラットフォームのβ版を提供
IT関連
2024-03-17 23:03
「Windows」の更新管理を自動化、「Windows Autopatch」とは–今知っておきたいこと
IT関連
2022-04-13 00:14
HRテックのEDGEが約1.5億円を調達してMBO完了、社員の価値観を可視化する新サービスも提供開始
HRテック
2021-04-21 10:36