セレブラス、「利用時間に基づく」AIサービスを提供–8倍高速で価格は半分

今回は「セレブラス、「利用時間に基づく」AIサービスを提供–8倍高速で価格は半分」についてご紹介します。

関連ワード (クラウド等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 人工知能(AI)コンピューターメーカーであるCerebras Systemsは米国時間11月29日、研究目的にとどまらず、商用利用も増えてきている大規模言語モデルの処理を高速化するサービスを発表した。同社は、チップおよびコンピューターの開発を手掛けており、最近ではディープラーニング(DL)を高速化するための専用スーパーコンピューターの開発も進めている。

 同社の共同創業者であり、最高経営責任者(CEO)のAndrew Feldman氏は報道陣に向け、「大規模言語モデルは過大評価ではなく、過小評価されていると考えている」と述べた上で、「われわれは、そのインパクトを目にし始めたところだ。今後、大規模言語モデルのエコシステムにおけるハードウェアレイヤーとインフラレイヤー、アプリケーションレイヤーの3つの層でそれぞれ勝者や、新興企業が台頭してくるだろう」と語った。

 また同氏は、「2023年には、経済のさまざまな分野で大規模言語モデルのインパクトが急速に高まっていくのを目にするようになるだろう」と予測した。

 同社は、クラウドコンピューティングサービスプロバイダーであるCirrascale Cloud Servicesとの提携により、「利用時間に基づく」かたちでコンピュート能力を提供する。つまりユーザーは、OpenAIの「GPT-3」といった大規模言語モデルの集中的な訓練を、DL用に開発された「Cerebras CS-2」コンピューターのクラスターを用いてフラットレートで実行できるようになる。

 このサービスは「Cerebras AI Model Studio」という名称で展開される。

 その価格は、13億個のパラメーターを用いるGPT-3モデルを0.4日使用する場合、2500ドル(約35万円)、700億個のパラメーターを85日間使用する場合、250万ドル(約3億5000万円)となっている。これは、同等の作業を実行しようとした場合に必要となる、数年分のクラウド能力のレンタル料金やマシンのリース料金と比べると、平均で半分程度で済むようになっている。また、CS-2クラスターの処理速度は、クラウド上の「NVIDIA A100」搭載マシンのクラスターを用いた訓練速度と比べると8倍に達するという。

 Cirrascaleは、自社のCS-2クラスターと、Cerebrasが所有するマシンとともに、カリフォルニア州に拠点を置くColovoreのサンタクララの施設にコロケーションされているスーパーコンピューター「Andromeda」を組み合わせて使用している。なお、この施設にはCirrascaleの機器も設置されている。

 同サービスに関する今回の提携は、クラウド上のCS-2マシンを週単位で提供するという、CerebrasとCirrascaleの間で締結された2021年の提携に続くものとなっている。

 Feldman氏によると、このサービスは言語モデルの規模に応じてクラスターのサイズを自動的に調整するようになっているという。またCerebrasは、マシンを追加することで訓練のパフォーマンスが線形に向上していくという点を強調している。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
レノボ、ハイブリッドAI戦略を推進–NVIDIAと新基盤、第6世代液冷など披露
IT関連
2024-10-18 14:46
安全なデータなくして、AI活用は成立し得ない–クリックテック・今井氏
IT関連
2024-01-06 19:44
第3回 リモート接続のセキュリティ対策
IT関連
2023-06-29 00:55
iPhoneのパスワードレス機能はWindowsとも連携するとAppleが発表。Windows上のChromeにiPhoneをかざしてログインも可能に、FIDO標準への対応で
FIDO/WebAuthn
2022-06-08 04:38
窓型スマートディスプレイのアトモフが「スター・ウォーズ」の風景を楽しめる新モデル
ハードウェア
2021-02-20 22:42
創価大学、出張のチケット手配から会計までを一本化–独自の運用規定に対応
IT関連
2021-08-04 07:56
「テディにも野菜あげて」の声届く 「PUI PUI モルカー」ぬいぐるみ、にんじんの着せ替えパーツ付きに
くらテク
2021-02-07 04:08
AWS、コンテナにWebアプリを置くと簡単にデプロイが完了する「App Runner」リリース。オートスケール、ロードバランス、証明書の管理などすべておまかせ
AWS
2021-05-24 18:00
いま求められる、改ざん不能を武器とするブロックチェーンの応用
IT関連
2021-03-05 04:34
LIXIL、ローコード開発基盤の整備で数億円単位のコストを削減
IT関連
2023-07-07 13:15
IIJ傘下のディーカレット、暗号資産取引所を開設
企業・業界動向
2021-04-20 21:02
「Oracle Database@Google Cloud」正式提供開始。Google Cloud上にOracle Cloudのインフラを持ち込み。Oracle CloudWorld 2024
Google Cloud
2024-09-11 11:13
無償で働くオープンソース開発者たちは自分の「力」に気づき始めている
IT関連
2022-01-26 18:50
セキュリティに積極的な企業は業績などが良い–アクセンチュア調査
IT関連
2023-08-04 04:07