SambaNova Systems、言語モデルに最適化された半導体「SN40L」を発表

今回は「SambaNova Systems、言語モデルに最適化された半導体「SN40L」を発表」についてご紹介します。

関連ワード (ビッグデータ等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 フルスタックAIプラットフォームベンダーSambaNova Systemsは9月19日、新しい半導体「SN40L」を発表した。同社の大規模言語モデル(LLM)プラットフォーム「SambaNova Suite」を強化する。

 SN40Lは、言語モデルに最適化され、シングルシステムノードでシークエンス長が25万で、5兆個のパラメータを扱うことが可能。TSMCの5nmテクノロジーをベースとし、104.3Kmのワイヤー長、1026億個のトランジスターを持つ。同社「Cerulean」アーキテクチャーに基づく再構成可能なデータフローユニット(Reconfigurable Dataflow Unit:RDU)コアを1040個搭載し、638TFLOPS(bf16)という性能を備える。

 SN40Lの特徴の一つとして、同社で製品担当上級副社長を務めるMarshall Choy氏は、3層データフローメモリーの採用を挙げる。従来は高速なオンチップメモリーと大容量のDDRメモリーという2層だったが、Ceruleanベースのアーキテクチャーでは中間層として広帯域メモリー(HBM)を加えて3層としているという。

 3層のデータフローメモリーにより、学習性能はワークロードにもよるが1.5〜2倍以上まで向上し、推論性能も大幅に改善しているとChoy氏は述べ、1兆パラメータ級で300トークン/秒の推論性能を持ち、「NVIDIA DGX H100」と比べて推論スループットは2.5倍とアピールする。

 SN40Lの発表とともに、SambaNova Suiteの機能強化も明らかにした。SambaNova Suiteは、オンプレミスまたはクラウドで展開可能で、半導体からモデルまでが統合されている。今回、事前学習済みファンデーションモデルが「Bloom 176B」「Llama-2 7B/70B」にも対応した。

 また、ベクトルベースの検索補完生成(RAG)のための新しい埋め込みモデルは、ユーザーの文書をベクトル埋め込みに取り込むことを可能にし、Q&Aの過程で検索することができ、ハルシネーション(幻覚)を防ぐ。その結果をLLMにより情報を分析、抽出、要約できる。

 他には、音声データの書き起こしおよび分析する自動音声認識モデル、マルチモーダルおよび長いシーケンス長の機能の追加、3層のデータフローメモリーによる推論にも最適化されたシステムなどが含まれる。

 アジア太平洋地域ゼネラルマネージャーを務める鯨岡俊則氏は、生成AIに関する現在のトレンドについて触れ、コンシューマーと企業とで用途の違いがあると述べる。企業用途では、特定領域に特化したコーパスや社内の議事録・レポートといった機密性の高い非公開データを学習に使う必要があるという。

 また、同氏は、顧客が生成AIモデルを所有する重要性も指摘する。SambaNovaが提供する顧客所有モデルの場合、「組織内部のデータの正確性」「安全かつ非公開でモデルを適応」「モデルの重みの可視性」「学習データと学習方法の可視性」といった利点とともに、異なるプラットフォームへのモデル移動可能性を挙げる。

 SN40Lは、クラウドでの利用は可能で、出荷は、オンプレミス対象で11月を目途に開始する予定だという。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
企業向けID管理のOktaがSaaSへのログイン統計発表、Office 365が(一応)トップ
ネットサービス
2021-01-31 22:45
株主優待:10万円以下で買える–人気優待株のスクリーニング方法を解説
IT関連
2021-08-17 21:05
Webアプリ版Photoshopを実現させた最新Web技術をGoogleが紹介。WebAssemblyのスレッドによる高速化、ストリーミングコンパイル、Web Componentsなど
Adobe
2023-10-25 06:30
AWS、エッジにおけるJavaScript実行環境に本格参入 CloudflareやDenoなどの競合に
クラウドユーザー
2021-05-09 22:33
primeNumber、「trocco」にフリープランを追加–データ活用の一連の流れを体験可能
IT関連
2023-02-11 11:51
NSSOL、次世代クラウドサービス基盤に「Cisco ACI」と「Cisco Nexus Insights」導入
IT関連
2021-04-22 21:15
デジタルツインで店舗運営を最適化–エヌビディア、小売業での取り組み解説
IT関連
2023-02-25 07:21
Linuxシステムを標的にするマルウェアが大幅アップデート–MSが警告
IT関連
2022-07-02 06:41
「Google Workspace」に複数のアップデート–個人事業主向けの新サブスクも
IT関連
2021-06-15 07:45
コロナ禍でサイバーリスク高まる、フィッシングなど深刻に–英政府報告
IT関連
2021-03-26 15:12
「やりたいビジネスをデジタルでどれだけできるか」が見極められるDX人材を育てよ
IT関連
2021-04-01 00:55
ZVC JAPANと宇和島市、DX推進に向け協定締結–災害時の情報共有に「Zoom」活用
IT関連
2023-11-15 10:43
「プライバシーテック」を武器にデータクリーンルームを構築–名大発ベンチャーの挑戦
IT関連
2023-12-12 03:39
データミックス、オンライン試験における不正をAIで検知
IT関連
2022-12-30 05:02