MS、小規模言語モデル「Phi-2」をリリース–最大25倍サイズのモデルの性能に匹敵

今回は「MS、小規模言語モデル「Phi-2」をリリース–最大25倍サイズのモデルの性能に匹敵」についてご紹介します。

関連ワード (ビッグデータ等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 生成人工知能(AI)との関連で言語モデルを考えるとき、真っ先に思い浮かぶのは大規模言語モデル(LLM)だろう。「ChatGPT」「Bard」「Copilot」など、人気のチャットボットを支えているのは、こうしたLLMにほかならない。しかし、Microsoftの新しい言語モデルは、小規模言語モデル(SLM)も生成AIの分野で大きな可能性を秘めていることを示している。

 同社は米国時間12月12日、常識的な推論と言語理解が可能なSLMの「Phi-2」を発表した。現在、「Azure AI Studio」のモデルカタログで利用可能となっている。

 「小規模」という言葉に惑わされてはいけない。Phi-2は27億個のパラメーターを持ち、その数は「Phi-1.5」の13億個から飛躍的に増加している。

 同社によると、Phi-2はパラメーターが130億個以下の言語モデルの中で「最先端の性能」を発揮し、複雑なベンチマークでは最大25倍の言語モデルを上回ったという。

 下図が示すように、Phi-2は、Metaの「Llama-2」やMistral AIの「Mistral」に加え、Googleが提供する高性能LLMの最小バージョンである「Gemini Nano 2」さえも、いくつかのベンチマークで凌駕した。

 MicrosoftはPhiの開発において、より大規模な言語モデルに匹敵する性能と新たな機能を持つSLMを目指しており、この性能結果はその目標と一致している。

 同社はPhi-2のトレーニングにあたり、データを厳選し、まず「教科書品質」のデータを用いたという。その後、学習するに値するかどうかとコンテンツの品質をもとに精選したウェブデータを追加し、言語モデルのデータベースを増強した。

 同社がSLMに注力しているのはなぜだろう。それは、LLMに対するコスト効率の優れた代替となるからだ。SLMはLLMほどのパワーを必要としないタスクで役立つ。LLMよりはるかに少ない計算能力で実行できるため、データの処理要件を満たすために高額なGPUへ投資する必要がなくなる。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
廃棄物だった「焼酎かす」を電力へ–霧島酒造が進める循環型社会
IT関連
2023-01-24 15:25
SolarWinds製品に対する攻撃、ロシアの諜報機関が背後に–米英が公に非難
IT関連
2021-04-16 22:27
NTTグループと飛島建設、建設現場のデジタル化で新会社–BPOなどを提供
IT関連
2022-03-05 02:51
RobinhoodがGameStopなどのユーザー保有株数を1株に制限
ネットサービス
2021-02-01 09:54
ZVC JAPANが示す、コロナ禍後の「Zoom」の在り方–「Zoom Experience Day Tokyo」
IT関連
2023-04-28 09:57
アメリカン・エキスプレスがBodesWellと提携しファイナンシャルプランニング分野に進出
フィンテック
2021-07-18 18:30
HRテックのEDGEが約1.5億円を調達してMBO完了、社員の価値観を可視化する新サービスも提供開始
HRテック
2021-04-21 10:36
「Gmail」、リスクのある操作に2段階認証を求める機能を追加
IT関連
2023-08-30 19:18
退屈な教科書に代わる学習教材を提供するNewselaが約106億円を調達しユニコーンに
EdTech
2021-02-27 00:21
6割以上の組織でサイバー攻撃が増加、約半数に実被害–Splunk調査
IT関連
2022-04-22 21:44
次期「.NET 8」プレビューリリース初公開。ネイティブコンパイラ改善で生成バイナリが約半分に、「Blazor United」登場など
.NET
2023-02-24 23:46
Anaplan Japan、不確実性が増すビジネス環境下の計画業務を支援
IT関連
2023-12-17 11:31
電気代が数倍? 電力取引価格の高騰で「市場連動型プラン」がピンチ 対応に追われる電力小売事業者
くらテク
2021-01-13 07:15
日本国土開発、SAPの次世代ERPを本番稼働–経営管理情報を可視化
IT関連
2021-04-27 07:30