Anthropic、悪用リスク増大を受けAIモデルの安全管理ポリシーを改定

今回は「Anthropic、悪用リスク増大を受けAIモデルの安全管理ポリシーを改定」についてご紹介します。

関連ワード (セキュリティ等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 大規模言語モデル(LLM)「Claude」ファミリーの開発元であるAnthropicが、米国時間10月15日付で、自社ソフトウェアの安全管理ポリシーを改定した。同社はこれについて、悪意ある主体が人工知能(AI)モデルを悪用してサイバー攻撃を自動化する可能性があることを反映したものだとしている。

 公開されたPDF形式の文書は、Anthropicの「責任あるスケーリングポリシー」を詳述したもので、同社がAIモデルが悪用される継続的リスクのモニタリングに必要だとする、複数の手続き上の変更が概説されている。その中では、リスクの上昇に呼応した複数のレベルが設定されている。これは「AI安全レベル基準」(ASL:AI Safety Level Standards)と呼ばれるもので、ポリシー内では「技術および運用上の防護策」と定義されている。

 AIモデルの安全性に関するAnthropicの「定期検査」(「能力評価」と呼ばれる)の一環として、同社は「大々的な調査を要し、さらに強力な防護策が必要な可能性もある」能力を発見していくとしている。

 この能力は、サイバー運用における脅威だと説明されている。これは「高度な破壊的サイバー攻撃を大幅に強化または自動化する能力」であり、「ゼロデイ攻撃を実行可能な新しいエクスプロイトチェーンの発見や、複雑なマルウェアの開発、検知が困難な広範なネットワーク侵入の画策を含むが、これらに限定されるものではない」という。

 今回公開された文書には、この件を継続的に調べるために今後とられる措置が以下のように説明されている。

 現時点で、AnthropicのAIモデルはすべて、ASLの「レベル2」の要件を満たさなければならないと、同社は述べている。レベル2とは「日和見的な攻撃者の大半を阻止するとみられるセキュリティシステムが必要となる」段階で、具体的には「ベンダーとサプライヤーによるセキュリティ評価や、物理的なセキュリティ対策、セキュアバイデザインの原則の採用が含まれる」と今回公開された文書には書かれている。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
「Android 14」、最初の開発者プレビューが公開
IT関連
2023-02-11 12:12
顔から感情をリアルタイムで読み取り分類 深層学習技術で :Innovative Tech
トップニュース
2021-03-21 01:39
ドール通販サイトで最大2万人超の個人情報流出 脅迫メールで不正アクセス発覚
セキュリティ
2021-08-21 12:56
総務大臣奨励賞に「シン・テレワークシステム」の登大遊さんら サイバーセキュリティ分野の功績を表彰
セキュリティ
2021-02-27 20:59
大阪市とAWSジャパン、生成AI活用に関する協定を締結–責任あるAI利用を追求
IT関連
2023-09-13 20:27
SmartNewsに「新型コロナワクチンチャンネル」 接種時期や施設を表示
企業・業界動向
2021-04-15 00:12
クニエ、データマネタイゼーションに取り組む企業を支援–「アイデア抽出サービス」を提供
IT関連
2024-06-20 08:42
手持ちのモノを売り支払いに充てられる決済プラットフォームTwigが約40.3億円調達、「グリーン」を謳うがそのサステナビリティにはほころびが見える
IT関連
2022-02-08 02:35
ピルのオンライン診察アプリの「ネクイノ」が法人向け健康経営支援プログラム「For Women’s 保健室」開始
フェムテック
2021-04-24 09:03
人はなぜ“言わなくてもいいこと”を言ってしまうのか 「日本人の国民性調査」からネット炎上が止まらない背景を探る :小寺信良のIT大作戦(1/3 ページ)
トップニュース
2021-08-18 03:32
クリス・サッカ氏の気候変動対策ファンド「Lowercarbon Capital」が880億円を集める
IT関連
2021-08-16 17:20
4歩行ロボ+3Dマップで公園管理を自動化 NTTコムウェア、平城京跡で実験
DX
2021-01-23 16:32
データセンターの自動化が加速する理由
IT関連
2021-05-13 18:37
アステラス製薬が推進するデータアナリティクスによる経営DX
IT関連
2023-03-29 20:51