IBM、東南アジア向けLLMのテストでシンガポールと提携

今回は「IBM、東南アジア向けLLMのテストでシンガポールと提携」についてご紹介します。

関連ワード (CIO/経営等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 IBMは、AI Singapore(AISG)の開発した東南アジア向け大規模言語モデル(LLM)をテストし、カスタマイズした人工知能(AI)アプリケーションを開発者が構築できるようにする取り組みで、AISGと合意した。

 この提携に基づき、IBMは自社のAIテクノロジーおよびデータプラットフォームである「watsonx」を使用して、「Southeast Asian Languages in One Network」(SEA-LION)と呼ばれるLLMをテストし、AISGと共同でこのLLMに細かい調整を加える。その狙いは、企業がビジネス要件に適したAIモデルを選択できるよう支援することだと、IBMとAISGはシンガポールで現地時間5月28日に発表した共同声明で述べている。

 IBMはまた、「Digital Self-Serve Co-Create Experience」(DSCE)と呼ばれる自社のAIユースケースライブラリーでSEA-LIONを利用できるようにし、開発者やデータサイエンティストがローカライズされた生成AIアプリケーションを構築できるようにする計画だ。

 SEA-LIONはAISGが開発したオープンソースのLLMで、他のLLMより小規模ながら、柔軟性に優れ、高速で動作するように設計されているという。現バージョンのSEA-LIONは、30億パラメーターと70億パラメーターの2つのベースモデルで動作する。また、このLLMのトレーニングデータは、9810億の言語トークンで構成されている。AISGの言うトークンとは、トークン化の過程で分解されたテキストから生成された言語の断片を意味するが、これらの断片には、6230億の英語トークン、1280億の東南アジア言語トークン、および910億の中国語トークンが含まれている。

 SEA-LIONを利用することで、シンガポールは、東南アジアの社会的多様性をより適切に反映し、この地域の文化と言語に対して優れた文脈理解能力を示すLLMの開発を推進したい考えだ。

 今回の提携の目的は、東南アジア人の手による東南アジア人のための「カスタムメイドの基盤モデル」を作成する取り組みの促進にあると、AISGでAI製品担当シニアディレクターを務めるLeslie Teo氏は語った。また、AISGとIBMは、ユースケースを構築し、SEA-LIONの採用を促進し、組織が「安全かつ責任ある形でAIをスケールアップ」できるよう支援することも目指しているという。

 今回発表された提携には、AIガバナンスをSEA-LIONに組み込むための取り組みも含まれている。そのため、AIに関する政府の規制が変化を続けるなかでも、企業はコンプライアンス、リスク、およびモデルライフサイクルの管理を適切に行えるようになる。

 「(IBMは)生成AIのさらなる進歩が小規模な言語モデルにおける優れたパフォーマンスをもたらし、ユーザーがビジネスや業界の要件に合わせてモデルをパーソナライズする機会が得られるようになると考えている」と、IBMで東南アジア地域のゼネラルマネジャー兼テクノロジー責任者を務めるCatherine Lian氏は、声明の中で述べている。

 Lian氏は、「企業にとって万能なモデルはなく、企業はニーズに合わせてモデルを使用する選択肢を与えられなければならない」として、「LLMのSEA-LIONは、オープンなAIシステムを構築し、企業や政府がAIの利用にあたって直面する東南アジア言語の課題に対処するための大きな一歩だ」と説明した。

 AISGは、3月にもGoogleとの提携を発表し、東南アジア固有の言語でAIモデルのトレーニング、調整、評価を行うために使われるデータセットを強化することを明らかにした。「Southeast Asian Languages in One Network Data」(SEALD)と名付けられたこのプロジェクトは、この地域向けに構築されたLLMで「文化的背景に対する認識を向上」させることを目指している。

 SEALDプロジェクトでは、まずインドネシア語、タイ語、タミール語、フィリピン語、ミャンマー語を対象に、AISGとGoogleがローカライズモデルと翻訳モデルを開発する。また、ローカライズ機能の拡張を支援するツールを構築し、データセット調整のベストプラクティスを共有し、東南アジア言語向けの事前トレーニングガイドを公開する計画だ。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
マイクロソフト「Azure Sentinel」にランサムウェア検知機能「Fusion Detection」
IT関連
2021-08-10 07:04
[速報]Google、AIが支援してくれる「Duet AI」サービス群を多数展開へ。Google WorkspaceやBigQuery、Looker、Meet、Chatなど。Google Cloud Next '23
Google
2023-08-30 00:18
Amazon Prime Day 2023を支えたAWS。GravitonプロセッサのAmazon EC2インスタンス投入で消費エネルギーが昨年比60%減に
AWS
2023-08-07 11:26
星野リゾート、クラウド型のCRM/BIツールを導入–来館予約のキャンセルを半減
IT関連
2021-03-27 05:20
トラックから信号機が次々出てくる? 自動運転AIの画像認識結果が話題に 対策は?
ロボット・AI
2021-06-15 04:41
クラウド録画サービスSafieが渋谷区のスマートシティ化を目指す「データ利活用事業」に採択、宮下公園で実証実験
IT関連
2022-02-10 17:38
AIが仕事や技術に与える影響とは–英オックスフォード大のオズボーン教授に聞く
IT関連
2023-02-09 14:10
Meta、オフィス内の福利厚生をわずかにカットへ–ハイブリッドワーク移行で
IT関連
2022-03-17 05:43
CloudflareはAWSのようなパブリッククラウドと競合する企業になるのか? 同社COOに直接聞いた
Cloudflare
2023-02-10 17:58
2要素認証でセキュリティ強化–設定方法、認証アプリ、保護すべきアカウント
IT関連
2024-02-14 02:04
第20回:2030年以降も生き残るIT部門・リーダーの姿とは? 先進テクノロジーとの正しい付き合い方–その1
IT関連
2022-10-15 01:06
日本IBM、独自LLM「Granite日本語版」を提供–日本語の長文を効率的に処理
IT関連
2024-02-29 22:34
レストランなどの食品調理業向け在庫管理マーケットプレイスを提供するブラジルのCayena
IT関連
2022-03-09 07:01
サイバー攻撃によるサプライチェーンリスクを経済安全保障問題として捉えよ
IT関連
2022-01-21 04:48