AWS、日本独自で生成AIの大規模言語モデル開発支援策を展開
今回は「AWS、日本独自で生成AIの大規模言語モデル開発支援策を展開」についてご紹介します。
関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。
本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。
アマゾン ウェブ サービス(AWS) ジャパンは7月3日、日本の法人組織を対象に生成AIの大規模言語モデル(LLM)開発を支援する独自施策「AWS LLM開発支援プログラム」を発表した。抽選で最大10組織程度を支援し、同日から21日まで専用フォームで応募を受け付けている。
このプログラムでは、(1)適切な計算機リソースの選定と確保に関するガイダンス、(2)技術相談やハンズオンの支援、(3)LLM事前学習における費用の一部負担、(4)ビジネスプランとユースケースなどの支援――を提供する。
支援対象の企業・団体は、(1)日本に拠点がありLLMを開発する、(2)数十億から1000億以上規模のパラメーターによるLLMの事前学習を実施する、(2)2023年11月末までに開発成果を出す目標がある、(4)LLMの効率的開発にクラウドを使う――が条件。AWSジャパンが技術的、ビジネス的、研究開発的などの観点で総合的に選考するという。なお、個別の相談事などは申し込み時に申告する。
AWSジャパンは、選考結果を7月中に通知する予定。スケジュールは、8月初旬にキックオフと計画立案を行い、8月中は必要に応じてプロトタイプの作成とパイロット開発のハンズオンを実施する。9~10月には参加者限定の中間報告会とネットワーキングを行う。11月に成果発表を準備し、12月に成果報告会を行うことにしている。
支援策の発表会に登壇した代表執行役員社長の長崎忠雄氏は、「長年にわたる機械学習(ML)のパラダイムシフトを迎えている。クラウドの大規模な計算能力とデータ活用の進展を通じて生成AIが社会に大きなインパクトをもたらし始め、さまざまな活用が期待される中で新しい体験をもたらす」などとコメント。Amazon自身も20年近くにわたり、ユーザーへの商品提案や需給予測、配送の最適化などに膨大なデータやMLを活用してきたとし、生成AIについてもユーザーの入力に対して最適な回答を提示するモデル開発などに長年取り組んできたと強調した。
こうした実績を踏まえて長崎氏は、一般の人々がMLを活用する“民主化”を実現すべくAIやMLの開発基盤群やサービス、専用インスタンスの提供と拡張を進めてきたとアピールした。米国時間6月22日には、グローバルで総額1億ドルを投じてユーザーの生成AIの開発を支援する「生成系 AI イノベーションセンター」の立ち上げも発表。こうした一連の取り組みを踏まえて今回は、生成AIの活用に向けてLLM開発に乗り出す日本の組織を支援する独自の枠組みを展開するに至ったと説明した。
AWS LLM開発支援プログラムについて、スタートアップソリューションアーキテクト シニアマネージャーの塚田朗弘氏は、対象組織に4つの広範な支援を提供する点に特徴があるとした。
具体的には、(1)適切な計算機リソースの選定と確保に関するガイダンスでは、ヒアリングを基に、NVIDIAや、LLMのコスト効率に優れた学習向けとなるAWS独自開発のチップ「AWS Trainium」、LLM推論向けの「AWS Inferentia2」などからユーザーの目的に沿う最適なインスタンスサービスの選定とリソースサイズを案内する。
(2)技術相談やハンズオンの支援では、分散型の学習環境やクラスター構成においてノード間を高速接続するネットワークサービスの活用方法や各種設定などのチューニングなどをAWSの技術者がサポートする。(3)のLLM事前学習における費用の一部負担では、LLの事前学習に用いるインスタンスサービスなどを対象に、総額600万ドル相当(7月3日時点の為替レートなどに基づく)の利用料などの一部支援を行う。
(4)のビジネスプランとユースケースなどの支援では、対象組織が開発したLLMを新規事業や既存事業などで活用していくフェーズを支援する。対象組織が開発したLLMを「AWS Marketplace」などで公開、販売できるようAWSが支援するほか、販売経路の拡大支援やスタートアップ企業などとの関係構築などもサポートする。
また、プリンシパル機械学習量子コンピューティングソリューションアーキテクトの宇都宮聖子氏は、今回のプログラムを通じて、生成AIの基盤モデルの開発、ユーザー要件に合わせた公開済み基盤モデルの活用、生成AIを活用した自社および外部向けアプリケーション開発の3つを対象に支援すると説明した。
生成AIの基盤モデルの開発では、まだ限定プレビューだが、「Amazon Bedrock」を用いて、「Amazon Titan」やAI21 Labsの「Jurassic-2」、Anthropicの「Claude」、Stability AIの「Stable Diffusion」の中からユーザーが自分たちのデータを用いて生成AIのための開発環境を整備でき、AWSがユーザーのデータやプライバシーを保護する。
また、ユーザーが「Amazon SageMaker JumpStart」を利用して、オープンソースあるいはプロプライエタリーな基盤モデルを柔軟に選択しながら迅速かつ容易に生成AIを開発でき、生成AIのコーティングなどを自動的にサポートする「Amazon CodeWhisperer」なども提供していると紹介した。
宇都宮氏によれば、オーストラリアのCanvaは、グラフィック生成サービスにおいて、SageMakerと画像生成AIサービスの「Stable Diffusion」を組み合わせて活用し、AIが事実と異なる内容を生成してしまう「AIハルシネーション」のリスクには、AWSの動画像分析サービス「Amazon Rekognition」を用いて対処しているという。
また、AI21 Labsも約1480億ものパラメーターの言語モデル学習に「Amazon EC2 P4d」や「PyTorch」を利用しているほか、日本ではリコーが、60億ものパラメーターを持つ日本語モデルの開発にSageMakerの分散学習やメモリー効率化技術を利用して学習時間を30%削減しているといった事例を紹介した。