セレブラス、「利用時間に基づく」AIサービスを提供–8倍高速で価格は半分

今回は「セレブラス、「利用時間に基づく」AIサービスを提供–8倍高速で価格は半分」についてご紹介します。

関連ワード (クラウド等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 人工知能(AI)コンピューターメーカーであるCerebras Systemsは米国時間11月29日、研究目的にとどまらず、商用利用も増えてきている大規模言語モデルの処理を高速化するサービスを発表した。同社は、チップおよびコンピューターの開発を手掛けており、最近ではディープラーニング(DL)を高速化するための専用スーパーコンピューターの開発も進めている。

 同社の共同創業者であり、最高経営責任者(CEO)のAndrew Feldman氏は報道陣に向け、「大規模言語モデルは過大評価ではなく、過小評価されていると考えている」と述べた上で、「われわれは、そのインパクトを目にし始めたところだ。今後、大規模言語モデルのエコシステムにおけるハードウェアレイヤーとインフラレイヤー、アプリケーションレイヤーの3つの層でそれぞれ勝者や、新興企業が台頭してくるだろう」と語った。

 また同氏は、「2023年には、経済のさまざまな分野で大規模言語モデルのインパクトが急速に高まっていくのを目にするようになるだろう」と予測した。

 同社は、クラウドコンピューティングサービスプロバイダーであるCirrascale Cloud Servicesとの提携により、「利用時間に基づく」かたちでコンピュート能力を提供する。つまりユーザーは、OpenAIの「GPT-3」といった大規模言語モデルの集中的な訓練を、DL用に開発された「Cerebras CS-2」コンピューターのクラスターを用いてフラットレートで実行できるようになる。

 このサービスは「Cerebras AI Model Studio」という名称で展開される。

 その価格は、13億個のパラメーターを用いるGPT-3モデルを0.4日使用する場合、2500ドル(約35万円)、700億個のパラメーターを85日間使用する場合、250万ドル(約3億5000万円)となっている。これは、同等の作業を実行しようとした場合に必要となる、数年分のクラウド能力のレンタル料金やマシンのリース料金と比べると、平均で半分程度で済むようになっている。また、CS-2クラスターの処理速度は、クラウド上の「NVIDIA A100」搭載マシンのクラスターを用いた訓練速度と比べると8倍に達するという。

 Cirrascaleは、自社のCS-2クラスターと、Cerebrasが所有するマシンとともに、カリフォルニア州に拠点を置くColovoreのサンタクララの施設にコロケーションされているスーパーコンピューター「Andromeda」を組み合わせて使用している。なお、この施設にはCirrascaleの機器も設置されている。

 同サービスに関する今回の提携は、クラウド上のCS-2マシンを週単位で提供するという、CerebrasとCirrascaleの間で締結された2021年の提携に続くものとなっている。

 Feldman氏によると、このサービスは言語モデルの規模に応じてクラスターのサイズを自動的に調整するようになっているという。またCerebrasは、マシンを追加することで訓練のパフォーマンスが線形に向上していくという点を強調している。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
KPMGコンサルティング、日本化薬におけるIT基盤強化構想の実行支援
IT関連
2023-06-03 15:17
Slackの情報集約機能「Slack canvas」が正式公開
IT関連
2023-04-27 02:01
「Excel」で行を固定表示するには
IT関連
2022-07-05 23:14
配送サービスの急増で混雑する道路の路肩スペース管理を請け負うスタートアップAutomotusに投資家も注目
モビリティ
2021-03-29 01:55
プログラミング言語「Rust」のための「Rust Foundation」設立–AWS、MS、グーグルらメンバー
IT関連
2021-02-10 08:42
「Windows 11」、ウィジェットからの通知をタスクバーに表示開始
IT関連
2022-08-19 06:59
NVIDIA、暗号通貨マイニング専用プロセッサ「CMP」 「RTX 3060」のマイニング効率には制限
製品動向
2021-02-20 21:56
「CES 2022」、ラスベガスでリアル開催へ–1月5日から
IT関連
2021-05-01 00:29
アップル新端末「iPhone 14」–買うべきモデルをユーザー別に考える
IT関連
2022-09-11 16:14
家庭用性感染症検査キットを提供しSTI検査の敷居を下げる米TBD Health
IT関連
2022-02-02 03:26
Cloudflare、分散SQLiteデータベース「Cloudflare D1」のオープンベータを開始
Cloudflare
2023-09-29 10:11
Metaの自己教師あり学習AI「data2vec」の可能性–より汎用的なAIへの布石へ
IT関連
2022-02-16 10:17
ハウステンボス、公式アプリにWOVNの多言語化ソリューション採用–翻訳関連コストを圧縮
IT関連
2024-01-21 10:46
サイバー攻撃後のデータ復旧を可能に–デルがAzure/AWS向けのデータ保護ソリューション
IT関連
2022-07-05 14:09