E・マスク氏肝いりの「Grok 3」、発表からわずか1日で「脱獄」される

今回は「E・マスク氏肝いりの「Grok 3」、発表からわずか1日で「脱獄」される」についてご紹介します。

関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 Elon Musk氏率いるxAIの最新モデル「Grok 3」が、公開からわずか1日でジェイルブレイク(脱獄)された。しかもその結果あらわになった問題は、かなり深刻だ。

 セキュリティとAIの安全性が専門で、AIモデルに対するレッドチーム演習を定期的に実施しているAdversa AIが米国時間2月18日、本来は提供すべきではない情報を「Grok 3 Reasoning」(ベータ版)に答えさせることに成功したとするレポートを公開した。Adversa AIのレッドチームは、言語的、対抗的、プログラミング的という3つの手法を用いることで、Grok 3 Reasoningに通常はAIモデルが回答しないように訓練されている事柄についても、回答を得るように仕向けることに成功したという。具体的には、システムプロンプトを公開させる、爆弾の作り方や、身の毛のよだつような遺体処理の方法を回答させる、といったことだ。

 Grok 3 Reasoningを発表した際、xAIの最高経営責任者(CEO)を務めるElon Musk氏はこのAIモデルが「Grok 2とはケタ違いの能力を持つ」と主張した。Adversaのレポートも、Grok 3の出す答えの詳しさが「これまでのどの推論モデルにもない」水準にあると認めている。だが、今回指摘された文脈においては、それがむしろ懸念すべき点となっている。

 Adversa AIのCEOを務めるAlex Polyakov氏は、米ZDNETへのメールで、セキュリティを危うくするのは、Grokが「実行可能な」説明を提供する点だと説明した(「DeepSeek」も、時に同様のことをするという)。

 「車のエンジンについて『このように機能する』と説明するのと『ゼロから作る方法は次のとおり』と教えることとの違いに似ている」とPolyakov氏は続けた。「通常、OpenAIやAnthropicのモデルのような、強力なセーフガードを備えたモデルを脱獄させても、そうして得た回答は詳細が濁されていて、実際の図面というより、曖昧な概要のようなものになることが多い」

 Adversa AIはレポートの中で、テストが「すべてを網羅した」ものでなかったことを認める一方で、Grok 3の安心と安全を確保するためのガードレールはいまだに「非常に弱い」もので「あらゆる脱獄手法が成功して、あらゆるリスクが現実になった」と結論づけている。

 Grokは設計上、競合するモデルよりもガードレールが少ない。これはMusk氏自身が喜んでいる特徴だ(2023年にGrokを発表した当時の資料にも、Grokが「他の大半のAIシステムでは拒否されるような際どい質問にも回答する」との一節がある)。また2024年には、ノースウェスタン大学の機械知能安全推進センター(CASMI)が声明を出し、当時の米大統領選でGrokが拡散した誤情報に触れて、「政治に関するクエリーについて強力なガードレールを実装したGoogleやOpenAIと異なり、Grokはそのような制約がない設計だった」と指摘している(xAIは5州で選挙当局に促されたのち、Grokを更新する形で、この問題に対処した)。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
長野県、洪水災害に備えるためのデータ連携プラットフォームを構築
IT関連
2023-09-30 13:58
Oktaのアクセス管理データからわかるクラウド利用のさらなる多様化
IT関連
2022-01-27 15:04
オムロンら3社、工場の無線化でWi-Fi 6とローカル5Gを比較検証
IT関連
2024-10-19 01:34
Facebookの幹部、「二極化はアルゴリズムのせいではない」と長文Mediumで擁護
企業・業界動向
2021-04-02 14:13
Tricentis、AI型テスト自動化ツールを日本で本格展開–伊藤忠商事が「S/4HANA」移行で活用
IT関連
2024-04-26 02:32
富士薬品、本部と店舗のコミュニケーションを改善–販促施策の実現率が3割向上
IT関連
2023-02-28 17:12
配当利回り4.4%–三菱UFJ FGの「買い」判断を継続
IT関連
2021-02-17 20:40
マイクロソフトとOpenAIが15兆円をAI用のスーパーコンピュータに投資、Amazonは22兆円をデータセンターに投資へ。米報道
AWS
2024-04-01 01:18
Meta、Pythonソフトウェア財団に約3600万円を寄付
IT関連
2022-03-27 23:35
マイクロソフト、マルチプラットフォームUIを実現する「.NET Multi-platform App UI」(MAUI)を実際にデモ。単一コードからWebとWindowsアプリを生成
.NET
2021-03-01 23:34
AWS、Splunkなどがセキュリティに関するメトリクスの標準化を目指す「Open Cybersecurity Schema Framework(OCSF)」を発表
AWS
2022-08-16 11:33
基本情報技術者と情報セキュリティマネジメントの合格者、年齢記録を3件更新
IT関連
2023-05-19 05:15
エッジもマルチクラウド化が進む–デルのグローバルCTOが説くトレンド
IT関連
2022-10-19 17:21
エイピアCEOが語る、初の通期黒字化と業績好調の背景
IT関連
2023-03-25 08:29