OpenAI、低コストの小型モデル「GPT-4o mini」の提供を開始

今回は「OpenAI、低コストの小型モデル「GPT-4o mini」の提供を開始」についてご紹介します。

関連ワード (CIO/経営等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 OpenAIは7月18日、大規模言語モデル(LLM)「GPT-4o」の小型版にあたる「GPT-4o mini」を発表した。OpenAIによると、GPT-4o miniは、「GPT-4」よりも精度が高く、開発者の使用時のコストを「GPT-3.5 Turbo」よりも大幅に低く抑えたバージョンで、AIモデルを広範に使用するアプリケーションの開発を加速させられるという。

 OpenAIはこの新しいAIモデルを「市場に出回っている中で最もコスト効率が高い小型モデル」とうたっているが、同社の大半の発表と同様に、GPT-4o miniの技術詳細(パラメーター数など)はまったく明かされていない。そのため、この発表で言う「小型」が具体的に何を意味するかははっきりしない。

 (「AIモデル」はAIプログラムの中でも、膨大な数のニューラルネットワークパラメーターと活性化関数を含む部分で、AIプログラムが機能する仕組みの中でも重要な要素とされる)

 OpenAIから米ZDNETにメールで送付されてきたブログ記事には、GPT-4o miniは「入力トークンは100万あたり15セント、出力トークンは100万あたり60セントと、これまでのフロンティアモデルよりも料金が1ケタ安く抑えられており、GPT-3.5 Turboよりも60%以上安い」とある。

 このコスト削減は活動のボリュームに影響を受けるアプリケーションの開発を後押しすると、OpenAIでは述べている。

 例えば、アプリケーションプログラミングインターフェース(API)を何度も呼び出さなければならないアプリケーション、素材をリトリーブするための「コンテキストウィンドウ」が大きいアプリケーション(アプリ開発時にコードベースを丸ごとリトリーブするなど)、ヘルプデスクでサポート業務を担うチャットボットのようにユーザーと頻繁にやりとりする必要があるアプリケーションなどが、1トランザクションあたりのコスト削減による恩恵を受けると、OpenAIは説明している。

 GPT-4o miniは、チャットボットとしての使用時には、GPT-4のスタンダードモデルのパフォーマンスを上回る(「LMSYS leaderboard」によるクラウドソーステストでの測定値)。また、「テクスチュアルインテリジェンスとマルチモーダル推論にまたがるアカデミックなベンチマークにおいて、GPT-3.5 Turboなどの小型モデルを上回っている」ほか、GPT-4oのスタンダードモデルと同じ数の言語に対応している。

 「マルチモーダル推論」の「MMU」テストのような一般的なAIベンチマークでも、GPT-4o miniモデルはほかのいくつかのモデルを上回り、GPT-4oのスタンダードモデルに迫るパフォーマンスを残している。

 GPT-4o miniは「Assistants API」「Chat Completions API」「Batch API」を通じて、開発者向けに即時提供されているほか、「ChatGPT」の無料アカウント、ならびに「Plus」あるいは「Team」アカウントでも、GPT-3.5 Turboの代わりに使うこともできる。

 GPT-4o miniは現時点でテキストと画像にしか対応しておらず、音声と動画への対応を予定しているが、具体的な日付は明らかにされていない。GPT-4o miniのコンテキストウィンドウは12万8000トークンで、トレーニングデータは2023年10月までのものになっている。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
DHLが2022年までにLocus Roboticsのユニットを2000台配備する計画を発表
ロボティクス
2021-06-04 12:16
NTT Comとトレンドマイクロ、セキュリティ対策が可能なeSIMを共同開発
IT関連
2022-02-17 04:59
GitLab、バグや脆弱性の検出ツール「GitLab Protocol Fuzzer Community Edition」をオープンソースで公開。APIやHTTP経由などでファジングを実行
GitLab
2021-04-05 20:32
テクノロジーを活用した新たな価値共創を多様な人材で推進する年–日本IBM・山口社長
IT関連
2023-01-07 13:07
PagerDutyに聞く、クラウドストライク障害の影響を最小限にした舞台裏
IT関連
2024-08-30 18:41
セルフケアに焦点を当てた音声ソーシャルネットワークQuiltが3.7億円調達
ネットサービス
2021-02-14 03:32
教育現場で進むデジタルツールとデータの活用–マイクロソフトが説明
IT関連
2022-12-14 01:39
アライドテレシス、AI/MLを用いてITインフラの運用・管理コストを削減
IT関連
2023-02-07 20:31
「LEVI’S×ポケモン」発売 ストーンウォッシュ「551z」にピカチュウ 90年代風デザイン
くらテク
2021-02-04 13:37
NY市が提訴した自転車シェアリングJOCOのサービス一時停止要求を裁判所が却下
シェアリングエコノミー
2021-05-09 19:03
第33回:「シニアひとり情シス」候補も売り手市場
IT関連
2021-05-13 06:35
富士通、24年度もキャリア採用拡充–新卒採用では「OPENコース」を廃止
IT関連
2024-03-21 20:08
新型コロナ後のリモート採用をサポートするDeelが約168億円調達、2020年に20倍成長しユニコーンへ
HRテック
2021-04-23 05:23
AIプロンプトエンジニアに必要な6つのスキルとは
IT関連
2023-07-11 05:31