セレブラス、「利用時間に基づく」AIサービスを提供–8倍高速で価格は半分

今回は「セレブラス、「利用時間に基づく」AIサービスを提供–8倍高速で価格は半分」についてご紹介します。

関連ワード (クラウド等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 人工知能(AI)コンピューターメーカーであるCerebras Systemsは米国時間11月29日、研究目的にとどまらず、商用利用も増えてきている大規模言語モデルの処理を高速化するサービスを発表した。同社は、チップおよびコンピューターの開発を手掛けており、最近ではディープラーニング(DL)を高速化するための専用スーパーコンピューターの開発も進めている。

 同社の共同創業者であり、最高経営責任者(CEO)のAndrew Feldman氏は報道陣に向け、「大規模言語モデルは過大評価ではなく、過小評価されていると考えている」と述べた上で、「われわれは、そのインパクトを目にし始めたところだ。今後、大規模言語モデルのエコシステムにおけるハードウェアレイヤーとインフラレイヤー、アプリケーションレイヤーの3つの層でそれぞれ勝者や、新興企業が台頭してくるだろう」と語った。

 また同氏は、「2023年には、経済のさまざまな分野で大規模言語モデルのインパクトが急速に高まっていくのを目にするようになるだろう」と予測した。

 同社は、クラウドコンピューティングサービスプロバイダーであるCirrascale Cloud Servicesとの提携により、「利用時間に基づく」かたちでコンピュート能力を提供する。つまりユーザーは、OpenAIの「GPT-3」といった大規模言語モデルの集中的な訓練を、DL用に開発された「Cerebras CS-2」コンピューターのクラスターを用いてフラットレートで実行できるようになる。

 このサービスは「Cerebras AI Model Studio」という名称で展開される。

 その価格は、13億個のパラメーターを用いるGPT-3モデルを0.4日使用する場合、2500ドル(約35万円)、700億個のパラメーターを85日間使用する場合、250万ドル(約3億5000万円)となっている。これは、同等の作業を実行しようとした場合に必要となる、数年分のクラウド能力のレンタル料金やマシンのリース料金と比べると、平均で半分程度で済むようになっている。また、CS-2クラスターの処理速度は、クラウド上の「NVIDIA A100」搭載マシンのクラスターを用いた訓練速度と比べると8倍に達するという。

 Cirrascaleは、自社のCS-2クラスターと、Cerebrasが所有するマシンとともに、カリフォルニア州に拠点を置くColovoreのサンタクララの施設にコロケーションされているスーパーコンピューター「Andromeda」を組み合わせて使用している。なお、この施設にはCirrascaleの機器も設置されている。

 同サービスに関する今回の提携は、クラウド上のCS-2マシンを週単位で提供するという、CerebrasとCirrascaleの間で締結された2021年の提携に続くものとなっている。

 Feldman氏によると、このサービスは言語モデルの規模に応じてクラスターのサイズを自動的に調整するようになっているという。またCerebrasは、マシンを追加することで訓練のパフォーマンスが線形に向上していくという点を強調している。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
ランサムウェア攻撃、2021年は2倍以上に増加–SonicWallレポート
IT関連
2022-02-19 04:27
わずか2cmの宇宙ごみを位相配列レーダーで検知し衛星との衝突をモニターするLeoLabs
宇宙
2021-06-05 18:32
長距離トラックの中継輸送から無駄な時間をなくすBatonが11.5億円調達
モビリティ
2021-03-27 06:02
ServiceNowのデジタルスキルトレーニング「RiseUp with ServiceNow」の展望
IT関連
2023-06-02 20:40
パナソニック、ビルを狙うサイバー攻撃にセキュリティ対策を提供
IT関連
2023-06-10 06:04
グーグル、ランサムウェア犯罪集団に初期アクセス手段を提供するブローカーとして働く組織を発見
IT関連
2022-03-20 02:57
「無印良品」の店内BGM、各種サブスクで配信 「部屋が完全に無印」
くらテク
2021-05-21 22:25
米ガートナー「ソフトウェアエンジニアリングのハイプサイクル2023年」を発表。「生成AI」や「プラットフォームエンジニアリング」は過度な期待のピーク
開発ツール
2023-12-07 08:14
RPAで終わるべからず–業務プロセスの高度化を訴求するBlue Prism
IT関連
2023-10-21 14:53
米国がExchangeサーバーのハッキングとランサムウェア攻撃で中国を非難、政府系ハッカー4人を起訴
セキュリティ
2021-07-21 19:29
サービスの信頼性と開発効率を両立するSRE–GoogleとJCBの取り組み
IT関連
2022-08-31 10:15
マッチングアプリ成否の分かれ道 話が弾み共通の趣味も合い実際に会えても……
IT関連
2021-01-19 10:40
信用スコアを利用した後払い決済サービス「芝麻先享」は人々の生活を豊かにするか
IT関連
2022-10-18 00:49
米国の空港で進む顔認識のテスト–過去には議員らが懸念を表明
IT関連
2023-05-17 02:17