MS、小規模言語モデル「Phi-2」をリリース–最大25倍サイズのモデルの性能に匹敵

今回は「MS、小規模言語モデル「Phi-2」をリリース–最大25倍サイズのモデルの性能に匹敵」についてご紹介します。

関連ワード (ビッグデータ等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 生成人工知能(AI)との関連で言語モデルを考えるとき、真っ先に思い浮かぶのは大規模言語モデル(LLM)だろう。「ChatGPT」「Bard」「Copilot」など、人気のチャットボットを支えているのは、こうしたLLMにほかならない。しかし、Microsoftの新しい言語モデルは、小規模言語モデル(SLM)も生成AIの分野で大きな可能性を秘めていることを示している。

 同社は米国時間12月12日、常識的な推論と言語理解が可能なSLMの「Phi-2」を発表した。現在、「Azure AI Studio」のモデルカタログで利用可能となっている。

 「小規模」という言葉に惑わされてはいけない。Phi-2は27億個のパラメーターを持ち、その数は「Phi-1.5」の13億個から飛躍的に増加している。

 同社によると、Phi-2はパラメーターが130億個以下の言語モデルの中で「最先端の性能」を発揮し、複雑なベンチマークでは最大25倍の言語モデルを上回ったという。

 下図が示すように、Phi-2は、Metaの「Llama-2」やMistral AIの「Mistral」に加え、Googleが提供する高性能LLMの最小バージョンである「Gemini Nano 2」さえも、いくつかのベンチマークで凌駕した。

 MicrosoftはPhiの開発において、より大規模な言語モデルに匹敵する性能と新たな機能を持つSLMを目指しており、この性能結果はその目標と一致している。

 同社はPhi-2のトレーニングにあたり、データを厳選し、まず「教科書品質」のデータを用いたという。その後、学習するに値するかどうかとコンテンツの品質をもとに精選したウェブデータを追加し、言語モデルのデータベースを増強した。

 同社がSLMに注力しているのはなぜだろう。それは、LLMに対するコスト効率の優れた代替となるからだ。SLMはLLMほどのパワーを必要としないタスクで役立つ。LLMよりはるかに少ない計算能力で実行できるため、データの処理要件を満たすために高額なGPUへ投資する必要がなくなる。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
UQ mobile、5G対応プランを9月から提供 価格は既存プランから据え置き
企業・業界動向
2021-08-03 03:17
全国のパン屋さんをD2C化するパンフォーユーが1.8億円調達、ベーカリー向けSaaS機能拡充
フードテック
2021-02-09 17:14
AWS、データ活用のボトルネックに対処する新サービスを多数発表
IT関連
2022-12-01 02:12
中堅企業3社が進めたDXプロジェクトの成果に見る知見と可能性
IT関連
2022-12-01 20:07
パスキーがAWS IAMの多要素認証として利用可能に
AWS
2024-06-12 19:14
脚光を浴びる「プラス・セキュリティ人材」–求められる理由とは
IT関連
2023-09-27 00:23
Snowflake、Python対応やアプリ開発を強化–トランザクション処理に対応する「Unistore」も追加
IT関連
2022-06-16 02:03
小学生向け「鬼滅の刃」無料ドリル、応募受付再開 30万人→60万人に拡大 進研ゼミ
くらテク
2021-02-17 22:07
Apple ID残高に定期的にチャージする「オートチャージ」が利用可能に
IT関連
2021-05-11 02:40
人気言語はJavaScript、PythonとJavaは拮抗–開発者エコシステム調査
IT関連
2021-07-25 14:03
Honda、AWS上に仮想車両開発環境を構築–SDVの実現に向けた協業へ
IT関連
2025-01-10 14:50
建設・建築業の半数以上が人材問題に直面–手形や現金の取引根強く、効率化が急務
IT関連
2023-06-17 23:07
エッジもマルチクラウド化が進む–デルのグローバルCTOが説くトレンド
IT関連
2022-10-19 17:21
日揮グループ、レノボのDaaS導入で国内拠点のPC約6000台を刷新
IT関連
2025-03-29 04:22