IBM、AIモデル「Granite」をオープンソース化–商用利用も可能に

今回は「IBM、AIモデル「Granite」をオープンソース化–商用利用も可能に」についてご紹介します。

関連ワード (CIO/経営等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 大規模言語モデル(LLM)のオープンソース化は、容易なことではない。Open Source Initiative(OSI)に聞いてみればいい。同団体は、人工知能(AI)に対応したオープンソースの定義に2年近く取り組んでいる。また、Meta Platformsなど一部の企業は、自社のLLMをオープンソース化したと主張しているが、実際にはそうではない。だが、IBMはついに、このオープンソース化をやってのけた。

 IBMは、GitHubで一般公開されているデータセット(「GitHub Code Clean」「Starcoder」、公開コードリポジトリ、イシューなど)で事前にトレーニングされたデータを利用して、コードLLM「Granite」のオープンソース化を実現した。つまり、IBMは著作権や法律がらみの問題を回避するために多大な労力を費やしてきた。Graniteコードベースモデルは、3〜4テラバイトのコードデータトークンや自然言語コード関連のデータセットでトレーニングされている。

 これらのモデルはすべて、Apache 2.0ライセンスの下で研究および商用を目的とする利用が許可されている。この「商用」という言葉こそが、他の主要なLLMのオープンソース化を阻んでいたものだ。他の企業はいずれも、自社のLLMがもたらす果実を共有することを望まなかった。

 しかし、IBM ResearchのチーフサイエンティストであるRuchir Puri氏は、次のように述べている。「われわれは、最もパフォーマンスが高く、コスト効率に優れたコードLLMを公開することによって、ソフトウェアにおける生成AIの現状を変え、オープンコミュニティーが制限を受けることなくイノベーションに取り組めるようにした」

 もっとも、制限はないとしても、想定される用途がないわけではない。

 Graniteモデルは「誰もがあらゆることを試せるようにするものではない」と、IBMでエコシステム担当ゼネラルマネージャーを務めるKate Woolley氏は2023年の段階で述べている。「これ(Granite)は愛犬についての詩を書くためのものではない。当社が企業に使ってもらいたいと考えているビジネスユースケースにターゲットを絞り、調整ができるように厳選したモデルだ。はっきり言えば、これはプログラミング向けだ」

 Graniteはデコード専用モデルで、116種類のプログラミング言語のコードでトレーニングされている。パラメーターの数は30億〜340億だ。複雑なアプリケーションのモダナイゼーションから、メモリーに制約のあるオンデバイスタスクまで、数多くの開発者の用途に対応する。

 IBMはすでに、自社の「watsonx Code Assistant」(WCA)製品のためにこれらのLLMを社内で利用している。例えば、「WCA for Red Hat Ansible Lightspeed」におけるITの自動化や、「watsonx Code Assistant for Z」における「COBOL」アプリケーションのモダナイゼーションなどだ。誰もが高価な「watsonx」を購入できるわけではないが、これからは、IBMとRedHatの「InstructLab」でLLMのGraniteを利用できる。

 RedHatのシニアバイスプレジデントで最高製品責任者(CPO)を務めるAshesh Badani氏によれば、InstructLabは「データサイエンスのスキル不足や必要なリソースの多さなど、ハイブリッドクラウド全体で生成AIが直面する障壁の多くを引き下げる」という。重要な点は、LLMを利用したいと考える開発者が参入しやすくすることだ。

 では、どの程度障壁が下がるのだろうか。RedHatの社長兼最高経営責任者(CEO)であるMatt Hicks氏は2023年の「Red Hat Summit」で、次のように述べている。「ほんの1年前まで、ハイエンドのかなり複雑なハードウェアに組み込まれていた機能が、今ではノートPCで実行できるようになった。これまで数億ドル(数百億円)かかっていたトレーニング技術も、今では数千ドル(数十万円)で同じことができる」

COMMENTS


Recommended

TITLE
CATEGORY
DATE
代替肉バーガーのImpossibleが今度は豚っぽいソーセージを米国大手スーパーで家庭用に発売
フードテック
2021-08-13 19:00
イーロン・マスク氏のインサイダー取引の可能性について米SECが調査開始
IT関連
2022-02-26 13:57
「データ管理のためのAI」と「AIのためのデータ管理」を支援–インフォマティカ・ジャパンの渡邉社長
IT関連
2023-12-28 23:51
オーストラリア、国家データセキュリティ行動計画の策定に着手–国民データの保護を強化
IT関連
2022-04-09 22:55
夏の停電対策に大切なこと :デジタル防災を始めよう(1/2 ページ)
くらテク
2021-08-22 18:18
発電所の煙突内にドローン 関西電力が新サービス
IT関連
2021-04-17 08:20
GPS用いた居場所探索規制へ 警察庁のストーカー規制検討会が報告書
IT関連
2021-01-30 13:00
「Zoomへの信頼を取り戻す」–ZVC Japanの佐賀代表に聞く
IT関連
2021-06-09 16:18
アイロボットが自動ゴミ収集機付属で10万円以下の掃除ロボ「ルンバi3」発表、数カ月はゴミ捨て不要
ハードウェア
2021-02-18 16:01
郵便物のための出社を不要にする郵便クラウド受取サービス「atena」が新専用センターに移転し運用体制を強化
ネットサービス
2021-05-07 22:13
三浦春馬さんの公式インスタとWeiboは今後も存続 ファンの声受け方針変更か
ネットトピック
2021-07-27 10:41
第3回:ERPの未来を描く–経営効果を出す正しい活用法
IT関連
2023-03-16 09:07
社員の「プロアクティブ度」、40代で落ち込む傾向–日本総研ら調査
IT関連
2023-06-08 11:05
バイデン政権の労働長官はギグワーカーを従業員待遇にすべきと考えている
パブリック / ダイバーシティ
2021-05-01 01:41