OpenAI、最新モデル「GPT-4.5」の研究プレビューを公開
今回は「OpenAI、最新モデル「GPT-4.5」の研究プレビューを公開」についてご紹介します。
関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。
本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。
OpenAI 最高経営責任者(CEO)のSam Altman氏は先日、同社が開発中のモデル「GPT-4.5」と「GPT-5」に関するロードマップを公開した。同氏は「X」(旧Twitter)への投稿で、GPT-4.5(開発コード名:Orion)がチェーンオブソート(思考の連鎖)を用いない最後のモデルになることを明らかにしていた。それ以外の詳細は、今日まで謎に包まれていた。
OpenAIは米国時間2月27日、これまでで最も大規模かつ高性能なチャット向けモデルとしてGPT-4.5の研究プレビューを公開した。
同社によると、GPT‑4.5は、幅広い知識と深い世界理解を備え、ユーザーとの対話が先行するモデルより自然に感じられるという。誤った情報を生成するハルシネーションの低減、ユーザーの意図を汲み取る能力の向上、心の知能指数(EQ)の進化が期待される。
教師なし学習とリーズニング(推論)という2つの手法によってモデルの改善が図られている。「OpenAI o1」推論モデルとは異なり、GPT‑4.5はチェーンオブソート推論を採用していない。しかし、応答速度の向上や世界に対する深い理解と協調性の向上といった改善とともに、より高度な推論能力を提供する。
例えば、デモでは、ChatGPTにGPT-4.5とo1それぞれのモデルを用いて、憎悪に満ちた文章を生成させる試みが行われた。o1モデルの場合、応答にやや時間を要し、出力は1件のみであった。その内容は、憎悪の意図を深刻に捉え、口調もいくぶん厳しいものだった。対照的に、GPT-4.5モデルは2通りの応答を示した。1つは比較的穏やかな口調、もう1つはより深刻な口調だった。いずれの応答も露骨な憎悪表現は避け、「ユーザー」の行動選択への失望感を伝えるにとどまった。
同様に、両モデルに技術的なトピックに関する情報を提供するよう求めたところ、GPT-4.5はo1のより構造化された出力と比較して、より自然な流れの回答を提供した。結局のところ、GPT-4.5は、執筆や実用的な問題解決など、さまざまなトピックにわたる日常的なタスクを目的としている。
これらの改善を実現するために、GPT‑4.5は教師ありファインチューニング(SFT)や、人間のフィードバックを活用した強化学習(RLHF)を組み合わせている。
ライブ配信では、OpenAIが過去のモデルを振り返り、「GPT-1」から順に「なぜ海水は塩辛いのか」という問いに対する回答を比較した。結果は予想通り、世代を経るごとにモデルの回答精度は向上した。特にGPT-4.5では、OpenAIが「際立った個性」と評する特徴が表れ、頭韻などの技巧を凝らした、軽快で親しみやすい口調の魅力的な回答が生成された。
GPT-4.5は、検索、キャンバス、ファイルや画像のアップロードなどにも対応している。ただし、音声モード、動画、画面共有などのマルチモーダル機能は利用できない。今後は、AIがより自然に機能し、シンプルに活用できるユーザー体験の実現に向けて取り組んでいくとしている。
OpenAIは、改善点を厳しくテストするために、公開前に一連の安全性テストを実施している。評価の詳細な結果については、付属のシステムカードで公開されている。
現在、GPT‑4.5は 「ChatGPT Pro」プランのユーザー向けに提供されている。Proユーザーは、ウェブ、モバイル、デスクトップ版のモデルピッカーから利用可能となっている。「ChatGPT Plus」と「ChatGPT Team」では来週から、「ChatGPT Enterprise」と「ChatGPT Edu」では再来週から展開するという。
Altman氏によると、当初はPro/Plusユーザーへ同時にモデルを公開する意向だったが、そのためには「モデルの規模が非常に大きく、コストも高額だった」という。さらに、同社ではGPUの不足が生じたため、数万個のGPUを増設することでPlusユーザーへの提供を開始すると付け加えた。
GPT‑4.5は、「Chat Completions API」「Assistants API」「Batch API」の全ての有料プランの開発者にもプレビュー公開されている。