OpenAI、低コストの小型モデル「GPT-4o mini」の提供を開始

今回は「OpenAI、低コストの小型モデル「GPT-4o mini」の提供を開始」についてご紹介します。

関連ワード (CIO/経営等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 OpenAIは7月18日、大規模言語モデル(LLM)「GPT-4o」の小型版にあたる「GPT-4o mini」を発表した。OpenAIによると、GPT-4o miniは、「GPT-4」よりも精度が高く、開発者の使用時のコストを「GPT-3.5 Turbo」よりも大幅に低く抑えたバージョンで、AIモデルを広範に使用するアプリケーションの開発を加速させられるという。

 OpenAIはこの新しいAIモデルを「市場に出回っている中で最もコスト効率が高い小型モデル」とうたっているが、同社の大半の発表と同様に、GPT-4o miniの技術詳細(パラメーター数など)はまったく明かされていない。そのため、この発表で言う「小型」が具体的に何を意味するかははっきりしない。

 (「AIモデル」はAIプログラムの中でも、膨大な数のニューラルネットワークパラメーターと活性化関数を含む部分で、AIプログラムが機能する仕組みの中でも重要な要素とされる)

 OpenAIから米ZDNETにメールで送付されてきたブログ記事には、GPT-4o miniは「入力トークンは100万あたり15セント、出力トークンは100万あたり60セントと、これまでのフロンティアモデルよりも料金が1ケタ安く抑えられており、GPT-3.5 Turboよりも60%以上安い」とある。

 このコスト削減は活動のボリュームに影響を受けるアプリケーションの開発を後押しすると、OpenAIでは述べている。

 例えば、アプリケーションプログラミングインターフェース(API)を何度も呼び出さなければならないアプリケーション、素材をリトリーブするための「コンテキストウィンドウ」が大きいアプリケーション(アプリ開発時にコードベースを丸ごとリトリーブするなど)、ヘルプデスクでサポート業務を担うチャットボットのようにユーザーと頻繁にやりとりする必要があるアプリケーションなどが、1トランザクションあたりのコスト削減による恩恵を受けると、OpenAIは説明している。

 GPT-4o miniは、チャットボットとしての使用時には、GPT-4のスタンダードモデルのパフォーマンスを上回る(「LMSYS leaderboard」によるクラウドソーステストでの測定値)。また、「テクスチュアルインテリジェンスとマルチモーダル推論にまたがるアカデミックなベンチマークにおいて、GPT-3.5 Turboなどの小型モデルを上回っている」ほか、GPT-4oのスタンダードモデルと同じ数の言語に対応している。

 「マルチモーダル推論」の「MMU」テストのような一般的なAIベンチマークでも、GPT-4o miniモデルはほかのいくつかのモデルを上回り、GPT-4oのスタンダードモデルに迫るパフォーマンスを残している。

 GPT-4o miniは「Assistants API」「Chat Completions API」「Batch API」を通じて、開発者向けに即時提供されているほか、「ChatGPT」の無料アカウント、ならびに「Plus」あるいは「Team」アカウントでも、GPT-3.5 Turboの代わりに使うこともできる。

 GPT-4o miniは現時点でテキストと画像にしか対応しておらず、音声と動画への対応を予定しているが、具体的な日付は明らかにされていない。GPT-4o miniのコンテキストウィンドウは12万8000トークンで、トレーニングデータは2023年10月までのものになっている。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
前IntelのCEO、ボブ・スワン氏、大手VC「a16z」のパートナーに
企業・業界動向
2021-07-21 18:48
アウディの全電動クロスオーバーQ4 e-tronはダイナミックARディスプレイを搭載
モビリティ
2021-03-11 01:13
スリーシェイク、ゲーム要素の脆弱性検査サービスをリリース
IT関連
2022-05-27 13:48
国内クラウド市場は5年で約2倍成長、2028年には16兆円超に。今後は基幹系システムのクラウド移行などが牽引。IDC Japan
クラウド
2024-06-14 05:57
「Raspberry Pi OS」がアップデート–テキスト検索やネットワーク管理機能が強化
IT関連
2022-09-14 16:05
[速報]GitHub Codespacesが全ユーザーに無料提供へ、毎月60時間分。JetBrainsとJupyterLabもIDEとして選択可能に
GitHub
2022-11-10 09:55
ウイングアーク1st、「invoiceAgent 電子取引」提供–取引文書の配信から保管を一括運用
IT関連
2022-06-22 16:52
汎用人工知能(AGI)の可能性–実現までの道のりと規制などの課題
IT関連
2023-10-24 07:46
グーグル、「Chrome」のゼロデイ脆弱性を修正
IT関連
2022-07-07 12:41
「Python 3.12.0」、正式版がリリース
IT関連
2023-10-05 10:22
セガサミーHD、「Recorded Future」導入でプロアクティブな対策強化
IT関連
2024-07-26 19:35
「Copilot」として、皆さまの成長を支援–日本マイクロソフト・津坂氏
IT関連
2024-01-06 11:48
八十二銀行、融資先の支援タイミングをAIで早期検知–予測モデルの構築/運用を内製化
IT関連
2022-07-09 13:24
日立、2022年度第1四半期決算は増収減益–デジタル好調も半導体などに課題
IT関連
2022-08-02 09:35