WebAssemblyとWebGPUを用い、Webブラウザ上でStable Diffusion Turbo全体を高速実行可能な推論エンジン「ONNX Runtime Web 1.17」マイクロソフトから登場

今回は「WebAssemblyとWebGPUを用い、Webブラウザ上でStable Diffusion Turbo全体を高速実行可能な推論エンジン「ONNX Runtime Web 1.17」マイクロソフトから登場」についてご紹介します。

関連ワード (性能、機械学習、機械学習処理等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、Publickey様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


マイクロソフトはWebブラウザ上で実行可能な推論エンジン「ONNX Runtime Web」の最新版となる「ONNX Runtime Web 1.17」でWebGPUに対応したことを発表しました。

ONNX Runtime Web 1.17でWebGPU対応を発表

ONNX Runtime Webの基になっている「ONNX Runtime」はクロスプラットフォーム対応の推論エンジンです。TensorFlow、PyTorch、SciKit Learnなどをはじめとするさまざまな機械学習のモデルに対応し、これらで生成されたモデルによる推論処理をプラットフォームに依存せず実行するランタイムの役割を果たします。

ONNX Runtime WebはこれをWebブラウザに対応させた実装です。これまでWebAssemblyやWebGLを用いていました。

参考:マイクロソフト、WebAssemblyとWebGLで推論エンジンを実装した「ONNX Runtime Web」(ORT Web)をオープンソースで公開

今回のONNX Runtime Web 1.17で対応したWebGPUは、Webブラウザ上でJavaScriptを用いた2次元や3次元の高速なグラフィックスの描画を行うWeb標準として広く使われてきた「WebGL」の後継となる、新しいWeb標準です。

WebGPUはオーバーヘッドが小さく低レイヤでの処理が行えることでGPUの能力をより高く引き出せるため、Webブラウザでの高速なグラフィクスレンダリングや機械学習処理などを可能にします。

WebGPU対応により、ONNX Runtime Webはこれまで以上にGPUを活用した高速な推論処理が可能となりました。

Webブラウザ上でStable Diffusion Turboを実行

マイクロソフトは今回の発表を行ったブログ「ONNX Runtime Web unleashes generative AI in the browser using WebGPU」で、Webブラウザ上でStable Diffusion TurboのようなAIモデルを実行できるようになると次のように説明しました。

This innovation unlocks new possibilities for executing state-of-the-art sophisticated models like Stable Diffusion Turbo directly in the browser. It is particularly advantageous in scenarios where CPU-based in-browser ML falls short of meeting performance standards. >

この技術革新により、Stable Diffusion Turboのような最先端の洗練されたモデルをブラウザで直接実行する新たな可能性が開かれた。特にCPUベースでのWebブラウザ内AI処理が性能に見合わない場合に有効となる。

これまでのWebGLと比較してWebGPUはより効率的な素理論が可能だと説明されています。

Compared to WebGL, WebGPU is capable of handling more complex machine learning workloads in a more efficient way with advanced features such as compute shader. Its support for half-precision (FP16) reduces GPU memory usage and bandwidth requirements while accelerating arithmetic. WebGPU promises inferencing more efficient and scalable machine learning applications directly within the web browser by harnessing GPU power for parallel computation tasks.

WebGLと比較して、WebGPUはコンピュートシェーダーなどの高度な機能により、より複雑な機械学習のワークロードをより効率的な方法で処理できます。半精度(FP16)をサポートすることでGPUのメモリ使用量と帯域幅の要件を削減すると同時に、演算を高速化します。WebGPUは並列計算タスクにGPUの能力を活用することで、スケーラブルな機械学習アプリケーションをWebブラウザ内で直接、より効率的に推論処理できるようになることを約束します。

そしてマイクロソフトはONNX Runtime Webを用いてWebブラウザ上でStable Diffusion Turboを実行可能なコードをGitHub上で公開しました。

マイクロソフトによると、GPUにRTX 4090を搭載したマシンのWebブラウザ上でStable Diffusion Turboを実際に実行した結果、1秒以内に結果が出力されたと説明しています。

参考:マイクロソフト、WebAssemblyとWebGLで推論エンジンを実装した「ONNX Runtime Web」(ORT Web)をオープンソースで公開

COMMENTS


Recommended

TITLE
CATEGORY
DATE
富士ソフト、TOTOの「設備管理サポートサービス」事業化を支援–AWSでIoTシステムを構築
IT関連
2023-07-30 07:27
モトローラがエントリー向け6.5型スマホ発表、1万8800円のmoto e7と1万6800円のe7 power
ハードウェア
2021-02-19 17:07
【インタビュー】人工流れ星の2023年に商用運用開始へ、10年の節目を迎える日本の宇宙スタートアップ「ALE」
宇宙
2021-07-17 03:08
Xamarinのサポートは2024年5月1日で終了。マイクロソフトが.NET MAUI関連のロードマップを示す
.NET
2022-08-25 18:01
CIPプロジェクト、Linuxカーネル6.1ベースのSLTSを発表–最低10年のサポート
IT関連
2023-10-21 22:18
SBI生命、「Amazon Kendra」の自然言語処理と機械学習をコールセンターに導入
IT関連
2023-07-13 13:48
グーグルがタブレットや折りたたみスマホに最適化した「Android 12L」を正式発表、2022年中に対応機種に提供
IT関連
2022-03-09 08:48
幼稚園・学校・塾・習い事教室の集金業務キャッシュレス化・DX化を実現する「enpay」が4億円調達
フィンテック
2021-04-02 13:38
全高75cm、口からミストを噴射する「マジンガーZ」を作る本 アシェットが創刊
くらテク
2021-02-05 20:28
アルペン、ツール連携で業務プロセスを自動化–約400店舗の運営を一気通貫
IT関連
2022-07-22 16:57
WindowsにLinuxカーネルの拡張機能「eBPF」実装へ
クラウドユーザー
2021-05-14 00:45
ソニー・ホンダモビリティ、カスタマーサービス領域に「Salesforce」を採用
IT関連
2024-04-12 14:10
「監督官庁からの天下りは人的わいろ」 SBG孫社長、“会食問題”など業界内の官民癒着を批判
企業・業界動向
2021-05-13 20:10
VCマネーの2%しか女性起業家に注がれない–VC立ち上げから5年、セリーナ・ウィリアムズ氏の挑戦
IT関連
2022-12-30 08:44