PyTorchやTensorFlow互換のAI処理高速化プラットフォーム「MAX」プレビュー公開、Pythonを高速化した「Mojo」搭載

今回は「PyTorchやTensorFlow互換のAI処理高速化プラットフォーム「MAX」プレビュー公開、Pythonを高速化した「Mojo」搭載」についてご紹介します。

関連ワード (今後、公開、実行等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、Publickey様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


Pythonの高速なスーパーセット「Mojo」言語を発表したことで話題となったModular社が、AI処理を高速化するプラットフォーム「MAX」(Modular Accelerated Xecution)のデベロッパーエディションをブレビュー公開しました。

MAX Developer Edition Preview has officially launched! It's a drop-in replacement for running and serving @PyTorch, @tensorflow and @onnxai models much faster and leverages the power Mojo for extensibility. Check out the blog posthttps://t.co/z6Nul9DADk

— Modular (@Modular) February 29, 2024

MAXは、AIの推論処理を高速に実行する「MAX Engine」、推論処理にアクセスするためのAPIなどのサービングシステムを提供する「MAX Serving」、そして高速な処理を実現するPython互換のプログラミング言語「Mojo」から構成されています。

MAXのアーキテクチャ

MAXは2023年12月のイベント「ModCon ’23」で発表され、今回デベロッパーエディションが公開されました。

ModCon '23で発表されたMAXModCon ’23で発表されたMAX

今回の注目点はMAX Engineが公開されたことでしょう。

MAX Engineは、推論処理を高速化するコンパイラおよびランタイムです。PyTorch、TensorFlow、ONNX形式のAIモデルであるMistral、Stable Diffusion、Llama2、WevLM、MLMR、ClipVitなどをサポートしており、これらの推論処理をMAX Engineに置き換えることで最大5倍高速なAI処理を実現します。

Modular社はベンチマーク結果も公開しており、Mistral-7Bは3.3倍、Stable Diffusionは1.7倍、Llamaでは2.3倍、MAX Engineの方が高速だとしています。

MAXのためのMAX SDK Developer Editionは現時点でUbuntu Linux版のみで、今後macOS版、Windows版のリリースも予定されています。

ただしMojo言語はすでにLinux版、macOS版が公開されています。

  • Pythonの高速なスーパーセットをうたう新言語「Mojo」、コンパイラなど公開、ローカル環境で利用可能に
  • 高速なPython互換言語「Mojo」のMac版登場、Appleシリコンにネイティブ対応。Pythonの9万倍、C言語に比肩する高速性

また今後は本番環境で利用可能なEnterprise Editionの提供、GPUへの対応なども進めていくとしています。

関連記事

  • 高速なPython互換言語「Mojo」を用いたAIプラットフォーム「MAX」発表。ModCon ’23

COMMENTS


Recommended

TITLE
CATEGORY
DATE
富士通、関節可動域を自動測定する「HOPE ROMREC」発売–病院などのリハビリを支援
IT関連
2021-03-01 08:24
コラボレーション型データサイエンス用ノートブック開発のためにDeepnoteが23.1億円調達
IT関連
2022-02-02 08:35
生成AIの力をアジャイルで引き出す–変化の激しい技術に短いサイクルで対応
IT関連
2024-04-20 14:21
macOSで「Bartender 5」のトリガー機能を使う–特定条件でメニューバーアイコンを表示
IT関連
2023-11-15 18:16
「Docker Desktop」のLinux版が登場
IT関連
2022-05-15 18:47
55機のキングエア航空機に自律飛行機能をステルスモードを脱したMerlin Labsが搭載
モビリティ
2021-05-30 20:30
エッジとAI、プライベートなデータの活用に自信–日本に進出する欧州発のGcore
IT関連
2023-09-22 15:40
「Zoom×生成AI」で何が起きるのか–ZVCエリック・ユアンCEOの野望
IT関連
2024-10-25 15:37
郵便料金の値上げによる請求書発行の追加費用は年間100万円超–Sansan調査
IT関連
2024-04-27 03:45
AWSジャパン、オペレーショナルレジリエンス向上を支援–金融戦略を説明
IT関連
2023-03-24 09:11
Twitter、青バッジ認証を一時停止 申請殺到でバックログ山積
アプリ・Web
2021-05-30 07:39
リモート会議で発生する排出量を追跡–シスコの「Carbon Emissions Insights」機能
IT関連
2023-03-07 18:18
freeeとワークスモバイルジャパンが協業–「チャットで勤怠(freee勤怠管理)」提供
IT関連
2023-07-22 22:31
AI導入で労働者の40%はリスキリングが必要–IBM調査
IT関連
2023-08-22 07:18