OpenAI、低コストの小型モデル「GPT-4o mini」の提供を開始

今回は「OpenAI、低コストの小型モデル「GPT-4o mini」の提供を開始」についてご紹介します。

関連ワード (CIO/経営等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 OpenAIは7月18日、大規模言語モデル(LLM)「GPT-4o」の小型版にあたる「GPT-4o mini」を発表した。OpenAIによると、GPT-4o miniは、「GPT-4」よりも精度が高く、開発者の使用時のコストを「GPT-3.5 Turbo」よりも大幅に低く抑えたバージョンで、AIモデルを広範に使用するアプリケーションの開発を加速させられるという。

 OpenAIはこの新しいAIモデルを「市場に出回っている中で最もコスト効率が高い小型モデル」とうたっているが、同社の大半の発表と同様に、GPT-4o miniの技術詳細(パラメーター数など)はまったく明かされていない。そのため、この発表で言う「小型」が具体的に何を意味するかははっきりしない。

 (「AIモデル」はAIプログラムの中でも、膨大な数のニューラルネットワークパラメーターと活性化関数を含む部分で、AIプログラムが機能する仕組みの中でも重要な要素とされる)

 OpenAIから米ZDNETにメールで送付されてきたブログ記事には、GPT-4o miniは「入力トークンは100万あたり15セント、出力トークンは100万あたり60セントと、これまでのフロンティアモデルよりも料金が1ケタ安く抑えられており、GPT-3.5 Turboよりも60%以上安い」とある。

 このコスト削減は活動のボリュームに影響を受けるアプリケーションの開発を後押しすると、OpenAIでは述べている。

 例えば、アプリケーションプログラミングインターフェース(API)を何度も呼び出さなければならないアプリケーション、素材をリトリーブするための「コンテキストウィンドウ」が大きいアプリケーション(アプリ開発時にコードベースを丸ごとリトリーブするなど)、ヘルプデスクでサポート業務を担うチャットボットのようにユーザーと頻繁にやりとりする必要があるアプリケーションなどが、1トランザクションあたりのコスト削減による恩恵を受けると、OpenAIは説明している。

 GPT-4o miniは、チャットボットとしての使用時には、GPT-4のスタンダードモデルのパフォーマンスを上回る(「LMSYS leaderboard」によるクラウドソーステストでの測定値)。また、「テクスチュアルインテリジェンスとマルチモーダル推論にまたがるアカデミックなベンチマークにおいて、GPT-3.5 Turboなどの小型モデルを上回っている」ほか、GPT-4oのスタンダードモデルと同じ数の言語に対応している。

 「マルチモーダル推論」の「MMU」テストのような一般的なAIベンチマークでも、GPT-4o miniモデルはほかのいくつかのモデルを上回り、GPT-4oのスタンダードモデルに迫るパフォーマンスを残している。

 GPT-4o miniは「Assistants API」「Chat Completions API」「Batch API」を通じて、開発者向けに即時提供されているほか、「ChatGPT」の無料アカウント、ならびに「Plus」あるいは「Team」アカウントでも、GPT-3.5 Turboの代わりに使うこともできる。

 GPT-4o miniは現時点でテキストと画像にしか対応しておらず、音声と動画への対応を予定しているが、具体的な日付は明らかにされていない。GPT-4o miniのコンテキストウィンドウは12万8000トークンで、トレーニングデータは2023年10月までのものになっている。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
京都市の通り名も対応、月額2000円の開発者向けクラウド郵便番号・住所検索APIサービス「ケンオール」公開
ネットサービス
2021-02-10 13:18
「SNSで家族と会話」は80代がシニア層でトップ、70代と大きな差──DMMのネット調査
企業・業界動向
2021-08-17 08:04
CO2排出量可視化・脱炭素化クラウドENERGY X GREENなど手がけるbooost technologiesが12億円調達
IT関連
2022-02-03 14:10
信用スコアを利用した後払い決済サービス「芝麻先享」は人々の生活を豊かにするか
IT関連
2022-10-18 00:49
国内企業のAI活用、リーダー企業とフォロワー企業で格差進む–IDC調査
IT関連
2021-03-17 00:57
New Relic、「APM 360」と「Infrastructure」のアップデートを発表
IT関連
2023-07-29 17:54
キノコ由来代替肉の豪スタートアップ「Fable Food」が米国へ進出
IT関連
2021-08-14 18:56
「nasne」予約再開 3月に初期出荷分が完売
ライフ
2021-04-11 00:58
明治、クラウド請求書受領サービス「Bill One」を導入
IT関連
2022-07-20 17:04
「バイアスのないAI」実現への道のりはデータから始まる
IT関連
2022-08-27 15:53
アイザワ証券、法人向けセミナー管理システム導入–参加者の情報を一元管理
IT関連
2022-04-12 12:33
住友電装、AIによる動画解析でカイゼンの立案と実施を加速化
IT関連
2024-06-20 06:49
日本IBMが2021年のパートナー事業で投資拡大–構築/サービス分野のパートナーに注力
IT関連
2021-02-18 11:44
コンテナランタイム「containerd 2.0」正式リリース、登場以来初のメジャーバージョンアップ。1.xとの互換性は維持
Docker
2024-11-12 22:56