「GPT-4」を公開したOpenAI、詳細な技術情報は非公開

今回は「「GPT-4」を公開したOpenAI、詳細な技術情報は非公開」についてご紹介します。

関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 人工知能(AI)研究の世界では、ソフトウェアに関する技術的な詳細情報について、他の研究者がそのプログラムを理解し、そこから何かを学べるように、研究論文として公開するのが通例だ。

 しかし、熱狂的な人気を博している対話型AI「ChatGPT」を手がけるOpenAIが、その心臓部を構成するプログラムの最新版「GPT-4」を米国時間3月14日にリリースしたとき、その伝統は絶たれた。

 OpenAIのブログ投稿と併せて14日にリリースされたGPT-4の技術レポートでは、競争と安全性を考慮して技術的な詳細情報の提供を控えると述べている。

 レポートには次のように書かれている。「GPT-4のような大規模モデルの競合状況および安全性の意味合いを考慮して」「このレポートでは(モデルサイズを含む)アーキテクチャー、ハードウェア、トレーニングコンピュート、データベースの構造、トレーニングメソッドなどの情報に関して、これ以上の詳細を述べない」

 「アーキテクチャー」という用語は、人工ニューロンがどのように張り巡らされ、どのAIプログラムにも必要不可欠な要素がどのような状態であるかという、AIプログラムの基本的な構造を意味する。また、プログラムの「サイズ」とは、利用しているニューラルの「重み」、つまりパラメーターの数のことで、特定のプログラムが他のプログラムとの違いをだすための重要な要素の1つだ。

 こうした詳細情報がないため、GPT-4は完全に謎のプログラムだ。この研究論文は、その意味で研究内容を何も明らかにしていない。

 このプログラムの構造について、レポートでは2つの文で非常に大まかに説明している。

 「GPT-4は、文書内の次のトークンを予測する訓練済みの『Transformer』形式モデルで、(インターネットデータなどの)利用可能な公開データと外部の提供事業者からライセンス供与されたデータの両方を利用している。モデルはその後、人間によるフィードバックを用いた強化学習(RLHF:Reinforcement Learning from Human Feedback)によって微調整されている」

 どちらの文も、このプログラムをざっと見れば分かる程度のことしか述べていない。

 こうした秘密主義は大半のAI研究者のやり方と異なる。他の研究所では詳細な技術的情報だけでなくソースコードも投稿することが多い。そうすることで他の研究者が結果を再現できるからだ。

 さらに、情報を非公開にするのは、これまで情報を限定的に公開してきたOpenAIのやり方とも異なっている。

 GPT-4は、その名称から分かるように、人間の言語を扱うために開発された「GPT」(Generative Pre-trained Transformer)というプログラムの4番目のバージョンだ。最初のバージョンを2018年にリリースした際、OpenAIはソースコードを公開しなかった。しかし同社は、GPT-1の各種パーツをどのように構成したか、つまりアーキテクチャーについて詳細に説明した。

 そうした技術情報が公開されたため、多くの研究者は構造を再現することは無理だとしても、プログラムの機能に関して推論することはできた。

 過去のやり方に反して、GPT-4の技術レポートは初めて非公開という方向に舵を切った。ソースコードや完成したプログラムだけでなく、外部の研究者がプログラムの構造を推測するための技術的な詳細情報も差し控えるという決定は、新たな種類の情報欠落と言えるだろう。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
マイク・タイソンやメイウェザーも支援、自宅でボクシングの練習ができるFightCamp
ネットサービス
2021-07-05 17:38
パナソニック、太陽電池生産から撤退
企業・業界動向
2021-02-03 17:20
サーバレスアプリのビジュアル開発ツール「AWS Application Composer」が正式版に。簡単にAWSサービスの構成や連携、デプロイなどが可能に
AWS
2023-03-09 17:25
「秀才1000人の信頼ではなく学生2000万人の納得が必要」Mosは急進的なフィンテックスタートアップを目指す
IT関連
2022-03-08 09:37
東大と日立、ビッグデータ活用した価値協創で連携強化–社会課題の解決を推進
IT関連
2022-04-06 12:50
地域通貨でファンの応援を可視化–スポーツを通じた地域創生を支援
IT関連
2021-02-03 00:30
mui Lab、木製ディスプレイの用途開発へ–スマートホームの普及に向け
IT関連
2024-01-25 18:10
北海道ジェイ・アール・システム開発、「SmartDB」を導入–現場開発による業務デジタル化を促進
IT関連
2022-08-23 23:36
Scaled Agile、経営層向けフレームワーク「SAFe Lean Portfolio Management」の日本語版を提供
IT関連
2022-09-16 22:30
マイクロソフト製Java 11ディストリビューション「Microsoft Build of OpenJDK for Java 11 LTS」正式リリース。無償長期サポート、コンテナイメージの配布も
Java
2021-05-27 09:42
IBMはレガシーを捨てクラウドとAIに集中するも結果を出せず売上減
ネットサービス
2021-01-23 05:15
「クラウドは経営者が考えるほど柔軟ではない」クラウド戦略の要諦を考える
IT関連
2021-04-03 06:09
「Windows 11」で廃止されるアプリや機能–「Cortana」も姿を消すことに
IT関連
2021-06-25 07:39
GitHub Copilot、開発中のコードがパブリックリポジトリのコードと150文字程度一致したら教えてくれる「code referencing」機能を追加
GitHub
2023-08-08 21:20