OpenAIなどのクローズドなAI開発のリスク、学者らが警鐘

今回は「OpenAIなどのクローズドなAI開発のリスク、学者らが警鐘」についてご紹介します。

関連ワード (CIO/経営等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 人工知能(AI)分野における2023年の出来事のうち、将来重大な影響を及ぼす可能性のあるものの1つは、「ChatGPT」を開発したOpenAIが3月に最新の大規模言語モデル(LLM)「GPT-4」を発表した際、このプログラムに関する詳細な技術情報を非公開にするという決定を下したことだ。

 同社が突如として秘密主義に転換したことが、テクノロジー業界にとって大きな倫理的問題になりつつある。というのも、OpenAIとそのパートナーであるMicrosoft以外の誰も、両社のコンピューティングクラウド内のブラックボックスで何が起こっているのかを知り得ないからだ。

 オックスフォード大学のEmanuele La Malfa氏とアラン・チューリング研究所およびリーズ大学の共同研究者らは9月、こうした問題をテーマとした論文をarXiv.org(査読なしのオープンアクセスジャーナル)に発表した。

 この論文で、La Malfa氏らは「サービスとしての言語モデル」(Language-Models-as-a-Service:LMaaS)という現象を考察し、ユーザーインターフェースやAPIを介してオンラインでホストされているLLMについて言及した。このアプローチの主要な例が、OpenAIのChatGPTとGPT-4だ。

 「商業的な圧力によって大規模かつ高性能なLM(言語モデル)が開発され、顧客向けサービスとして独占的にアクセスされる状態になった。これらのLMはユーザーのテキスト入力に対して文字列やトークンを返す。しかし、そのアーキテクチャー、実装、学習手順、学習データに関する情報は公開されておらず、内部状態を検査または変更することもできない」(論文)

 「アクセス制限はLMaaSに固有のもので、そのブラックボックス的な性質と相まって、一般の人々や研究コミュニティーがLMaaSをより良く理解し、信頼し、コントロールする必要性と相容れない」「このことは、この分野の核心部分において重大な問題を引き起こす。つまり、最も強力でリスクの高いモデルは、最も分析が難しいモデルでもあるということだ」

 この問題は、OpenAIの競合他社、特にクローズドソースのコードに対抗してオープンソースのコードを利用している企業を含め、業界内で広く指摘されてきたものだ。例えば、画像生成AI「Stable Diffusion」などのツールを開発している生成AIの新興企業、Stability AIの最高経営責任者(CEO)Emad Mostaque氏は、どの企業もGPT-4のようなクローズドソースのプログラムを信頼できないと述べている。

 同氏は4月に開催された報道陣と経営幹部らによる小規模な会合で、次のように述べた。「非公開データにはオープンモデルが不可欠になるだろう」「その中身をすべて把握しておく必要がある。これらのモデルは非常に強力だ」

 La Malfa氏と同氏が率いるチームは、さまざまな言語モデルの資料を調査し、密室での開発によって、プログラムのアクセシビリティーと反復可能性、比較可能性、信頼性という4つの重要な観点に立った監査がいかに妨げられるのかを明確にした。

 著者らは、これらはAI倫理において新たに出てきた懸念だとし、「これらの問題はLMaaSというパラダイムに特有のものであり、言語モデルにかかわる既存の懸念とは異なっている」と記している。

 アクセシビリティーはコードを非公開にするという話と関係があり、著者らによるとこれは大規模な研究開発(R&D)予算を有する大企業に偏重したかたちで利益をもたらすという。

 著者らは「計算処理に使えるリソースが企業間で大きく異なり、ごく一部の企業に集中している状況において、技術に優れているが計算処理についてはそうではない企業はジレンマに直面する。自社のLMaaSをオープンソースにすれば、市場でのプレゼンスや、コミュニティーによるコードベースへの貢献というメリットがある一方、モデルを支えるコードを公開することで競争上の優位性は、より豊富なリソースを有する企業によってあっという間に相殺されるおそれがある」と記している。

 これに加えて、LMaaSプログラムの均一化された価格は、ツールへのアクセス機会という点で、経済発展が遅れている地域の人々にとって不利に働く。研究者らは「こういった問題を低減するための手始めは、LMaaS、より一般的に言えばスタンドアローンで広く普及するディスラプティブ技術としての従量課金型AIサービスについて、その影響を分析することだ」と示唆している。

 もう1つの問題は、LLMの訓練方法における格差の増大だ。著者らによると、商業LLMは顧客のプロンプトを再利用できるため、公開されているデータのみを用いるプログラムに大きく差をつけられるという。

 著者らは、LMaaSの商用ライセンスによって、「企業がサービスを提供/維持/改善できるよう、その企業にプロンプトの使用権が与えられる」ため、訓練データについて万人が想定できる共通の基準が存在していないと記している。

 著者らは言語モデル別に、ユーザーのオプトアウトが可能なのか、訓練目的で顧客プロンプトを収集しているか、言語モデルの能力向上に向けた「微調整」を加えているのかを一覧できる表も掲載している。

 La Malfa氏と同氏のチームは、さまざまなリスクを詳細に説明した後、4つの分野に取り組むための「仮の議題」を提唱し、「研究者や政策立案者、一般大衆がLMaaSを信頼できるようにするためのソリューションを見いだすために、コミュニティーとして活動する必要がある」と促している。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
ロボットが飲み物をオフィスにお届け、セキュリティゲートを認証カードで通過 三菱地所が実験
ロボット・AI
2021-02-23 08:02
コロナ禍でパパ活蔓延 SNSで飛び交う隠語……企業公式アカウントで“誤爆”も
IT関連
2021-04-03 07:14
ジェフ・ベゾス氏が1.1兆円の気候変動対策基金「Bezos Earth Fund」のCEOに世界資源研究所の元所長を指名
EnviroTech
2021-03-17 22:19
暗号資産詐欺の被害額、米国で2021年以降に10億ドル超
IT関連
2022-06-07 00:59
グローバル開発コミュニティー連携と国際安全基準への適合を推進–サイバートラスト・眞柄社長
IT関連
2023-01-12 09:23
飲食店向けテイクアウトの予約・決済サービス「TakeEats」運営のランプが約1億円調達
ネットサービス
2021-02-02 05:01
オープンソースの安全性を高める「アルファ-オメガプロジェクト」、OpenSSFが開始。マイクロソフトとGoogleがプロジェクトリーダーに
オープンソース
2022-02-14 05:03
東京都市大学、磁気ヘッドの誤差を減らしデータセンター用HDDを30%大容量化する技術を開発
IT関連
2022-02-25 14:05
兼松、サイバーセキュリティ人材の育成研修を約2000人に実施
IT関連
2024-07-31 10:19
iPS細胞による免疫細胞臨床応用に向けた研究を進める京都大学発サイアスが21.3億円調達、研究開発体制拡充・米国展開へ
IT関連
2022-03-04 11:35
未来の小売業で担うAIの重大な役割
IT関連
2022-09-02 05:56
国内時価総額上位25社の12万件以上の「資産」が悪用のリスクに–テナブル調査
IT関連
2023-07-19 20:11
先端半導体にDXで対応する電子材料や電子部品–旭化成のデジタルソリューション事業
IT関連
2024-06-11 11:59
エイピアCEOが語る、初の通期黒字化と業績好調の背景
IT関連
2023-03-25 08:29