Meta、安全で責任あるAI開発を支援する「Purple Llama」プロジェクトを開始

今回は「Meta、安全で責任あるAI開発を支援する「Purple Llama」プロジェクトを開始」についてご紹介します。

関連ワード (セキュリティ等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 Metaは米国時間12月7日、開発者による責任ある人工知能(AI)の開発を支援するための包括的なプロジェクト「Purple Llama」(パープル・ラマ)を発表した。

 このプロジェクトの目的は、同社が2月に公開したオープンソースの大規模言語モデル「Llama」を使用する開発者に、サイバーセキュリティー向けのツールや検証、そして入出力のセーフガードを提供することだ。

 同社によると、生成AIのリスクを軽減するには、攻撃(レッドチーム)と防御(ブルーチーム)の姿勢を組み合わせたパープルチームのアプローチが必要だという。プロジェクトの名称はこの考え方に基づいている。

 Purple Llamaではまず、サイバーセキュリティー向けツールおよび検証、入出力のセーフガードを提供し、今後その数を拡充していく。プロジェクト内のコンポーネントはライセンス供与を行い、研究と商用の両方で利用できるようにする。これにより、開発者間の協業と、生成AIの安全性ツールの標準化を推進したい考えだ。

 サイバーセキュリティーに関しては、大規模言語モデル(LLM)について、業界全体を対象にしたサイバーセキュリティーの安全性評価を行い、結果を公開する。これには、LLMのサイバーセキュリティーリスクを定量化するための指標、LLMによる安全でないAI生成コードの提案頻度を評価するツール、LLMが不正なコードを生成しにくくするための対策などが含まれる予定だ。

 また、入出力セーフガードの一環として、開発者が潜在的リスクのある出力を生成しないようにするための基盤モデル「Llama Guard」を公開する。このモデルは、一般公開されている多様なデータセットで訓練されており、リスクや違反の可能性があるコンテンツを検出できる。

 Metaは、7月に同社の次世代版LLM「Llama 2」を公開した際に100社以上と協業しており、今回も多数の企業と協力しつつ、オープンなアプローチを取るという。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
登録者数累計3万人突破のキャリアSNS「YOUTRUST」がiOSアプリをリリース
HRテック
2021-04-13 09:24
「Midjourney」にウェブエディターが登場–アップした画像の編集が可能に
IT関連
2024-10-26 16:13
プロバイダー10社らがNTT西に要望書 一部地域の光回線工事再開を求め ただし意見に食い違いも
企業・業界動向
2021-03-16 15:08
今後数年間にひっ迫が予想される3つのテクノロジースキルとは–英調査
IT関連
2022-10-25 20:20
“無人決済みやげ店”羽田に登場 手に取った商品リアルタイム認識
ロボット・AI
2021-08-20 05:50
ノートンライフロックがアバストと合併–取引規模は1兆円近く
IT関連
2021-08-12 00:24
「無印良品」の店内BGM、各種サブスクで配信 「部屋が完全に無印」
くらテク
2021-05-21 22:25
GitHub、無料のパブリックリポジトリへのプッシュに対しても、コードに書いてはいけないシークレットの検知機能をデフォルトで有効に
GitHub
2024-03-05 09:40
ドン・ファン、一家殺傷、ALS……相次ぐ殺人事件解決の背景に「デジタル証拠」
IT関連
2021-06-08 01:27
ソニー「α1」やっぱり凄かった 高性能を誰でも享受できるフラッグシップ :荻窪圭のデジカメレビュープラス(1/6 ページ)
くらテク
2021-04-30 13:06
百戦錬磨の記者が選ぶ、使いやすく美しい理想のデスクトップOS「Zorin OS」
IT関連
2022-09-02 02:30
カーボン削り出しのトースター「Sumi Toaster」がなぜ最新のオーブントースターに勝てるのか 開発陣に聞いてきた :分かりにくいけれど面白いモノたち(1/5 ページ)
くらテク
2021-05-21 10:07
第13/14世代「Intel Core」CPU不具合のFAQ–該当モデルやパッチ入手方法など
IT関連
2024-08-24 10:24
生成AI支出、2027年に約21兆円規模に–IDC
IT関連
2023-10-18 22:16