Anthropic、悪用リスク増大を受けAIモデルの安全管理ポリシーを改定

今回は「Anthropic、悪用リスク増大を受けAIモデルの安全管理ポリシーを改定」についてご紹介します。

関連ワード (セキュリティ等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 大規模言語モデル(LLM)「Claude」ファミリーの開発元であるAnthropicが、米国時間10月15日付で、自社ソフトウェアの安全管理ポリシーを改定した。同社はこれについて、悪意ある主体が人工知能(AI)モデルを悪用してサイバー攻撃を自動化する可能性があることを反映したものだとしている。

 公開されたPDF形式の文書は、Anthropicの「責任あるスケーリングポリシー」を詳述したもので、同社がAIモデルが悪用される継続的リスクのモニタリングに必要だとする、複数の手続き上の変更が概説されている。その中では、リスクの上昇に呼応した複数のレベルが設定されている。これは「AI安全レベル基準」(ASL:AI Safety Level Standards)と呼ばれるもので、ポリシー内では「技術および運用上の防護策」と定義されている。

 AIモデルの安全性に関するAnthropicの「定期検査」(「能力評価」と呼ばれる)の一環として、同社は「大々的な調査を要し、さらに強力な防護策が必要な可能性もある」能力を発見していくとしている。

 この能力は、サイバー運用における脅威だと説明されている。これは「高度な破壊的サイバー攻撃を大幅に強化または自動化する能力」であり、「ゼロデイ攻撃を実行可能な新しいエクスプロイトチェーンの発見や、複雑なマルウェアの開発、検知が困難な広範なネットワーク侵入の画策を含むが、これらに限定されるものではない」という。

 今回公開された文書には、この件を継続的に調べるために今後とられる措置が以下のように説明されている。

 現時点で、AnthropicのAIモデルはすべて、ASLの「レベル2」の要件を満たさなければならないと、同社は述べている。レベル2とは「日和見的な攻撃者の大半を阻止するとみられるセキュリティシステムが必要となる」段階で、具体的には「ベンダーとサプライヤーによるセキュリティ評価や、物理的なセキュリティ対策、セキュアバイデザインの原則の採用が含まれる」と今回公開された文書には書かれている。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
シンフォニーマーケティング、BtoBマーケに特化した会員制研修プログラムを提供
IT関連
2022-07-14 14:27
“ソフトクリームを巻いて手渡す”ロボット実用化 人が触れずに提供
ロボット・AI
2021-07-29 18:57
実寸大、煉獄杏寿郎の「日輪刀」をバンダイが発売 セリフや効果音収録 劇中の「うまい!」を全て収録した「うまいモード」も
くらテク
2021-01-16 12:29
強気の米国株に全集中?–「長期金利の上昇」は下落のきっかけになるか
IT関連
2021-02-19 14:00
著名人の3DCGモデルを作成→キャスティングするサービス サイバーエージェントが芸能事務所向けに開始
ネットトピック
2021-08-03 06:53
クラウド本番環境で発生するインシデントをAIが検出、自動で原因特定、修復まで行う「Shoreline.io」をNvidiaが買収したとの報道
DevOps
2024-06-21 08:00
日本中央競馬会、公共性の高い競馬事業を支えるデータ保護基盤を統一
IT関連
2021-02-17 01:36
レノボ、IoTやAI処理向けのエッジ端末2機種を発表
IT関連
2021-07-06 07:02
世界最大級の食品会社が新製品を開発するとき、まず相談するAIデータ分析「Tastewise」
IT関連
2022-03-04 00:09
中国で広がるペットの鼻紋活用–保護した犬猫を照会を容易に
IT関連
2022-11-05 14:47
マイクロソフト、AIと音声認識のニュアンスを2兆円超で買収へ
IT関連
2021-04-13 13:02
「ドラクエ」のゲーム実況、個人の収益化OKに スクエニがガイドライン更新 「変化を前向きにとらえた」
企業・業界動向
2021-01-16 07:36
細胞培養スタートアップ「インテグリカルチャー」が培養肉技術を活用し世界初のスキンケア化粧品原料を開発
バイオテック
2021-04-09 23:06
時代は“脱ハンコ”へ コロナ禍で進む「電子契約/電子署名」の将来 慶応大の手塚教授に聞く
PR
2021-08-18 02:09