MS、小規模言語モデル「Phi-2」をリリース–最大25倍サイズのモデルの性能に匹敵

今回は「MS、小規模言語モデル「Phi-2」をリリース–最大25倍サイズのモデルの性能に匹敵」についてご紹介します。

関連ワード (ビッグデータ等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 生成人工知能(AI)との関連で言語モデルを考えるとき、真っ先に思い浮かぶのは大規模言語モデル(LLM)だろう。「ChatGPT」「Bard」「Copilot」など、人気のチャットボットを支えているのは、こうしたLLMにほかならない。しかし、Microsoftの新しい言語モデルは、小規模言語モデル(SLM)も生成AIの分野で大きな可能性を秘めていることを示している。

 同社は米国時間12月12日、常識的な推論と言語理解が可能なSLMの「Phi-2」を発表した。現在、「Azure AI Studio」のモデルカタログで利用可能となっている。

 「小規模」という言葉に惑わされてはいけない。Phi-2は27億個のパラメーターを持ち、その数は「Phi-1.5」の13億個から飛躍的に増加している。

 同社によると、Phi-2はパラメーターが130億個以下の言語モデルの中で「最先端の性能」を発揮し、複雑なベンチマークでは最大25倍の言語モデルを上回ったという。

 下図が示すように、Phi-2は、Metaの「Llama-2」やMistral AIの「Mistral」に加え、Googleが提供する高性能LLMの最小バージョンである「Gemini Nano 2」さえも、いくつかのベンチマークで凌駕した。

 MicrosoftはPhiの開発において、より大規模な言語モデルに匹敵する性能と新たな機能を持つSLMを目指しており、この性能結果はその目標と一致している。

 同社はPhi-2のトレーニングにあたり、データを厳選し、まず「教科書品質」のデータを用いたという。その後、学習するに値するかどうかとコンテンツの品質をもとに精選したウェブデータを追加し、言語モデルのデータベースを増強した。

 同社がSLMに注力しているのはなぜだろう。それは、LLMに対するコスト効率の優れた代替となるからだ。SLMはLLMほどのパワーを必要としないタスクで役立つ。LLMよりはるかに少ない計算能力で実行できるため、データの処理要件を満たすために高額なGPUへ投資する必要がなくなる。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
ウィズセキュア、持続可能性への取り組みで「W/Sustainability」プログラム導入
IT関連
2023-07-06 10:29
NECとSISの為替BPOサービス、全国44信用金庫1033店舗で稼働
IT関連
2022-05-24 07:39
アドビ、フェイク画像に対抗する「CAI」を解説–進化するデジタル技術の“守りの一手”
IT関連
2023-07-20 05:44
RedditまでClubhouseクローンな「Reddit Talk」のプレビュー開始
アプリ・Web
2021-04-21 16:06
AIをDevSecOpsプラットフォームに“編み込む”–GitLabのCSOが語るビジネス戦略
IT関連
2024-02-17 17:14
生成AIによる変化の影響が最も大きいのはキャリア中堅層–Indeed調査
IT関連
2023-10-28 10:06
コスパで勝負するクラウドストレージの中堅WasabiがシリーズCで約122億円調達
ネットサービス
2021-05-01 06:32
FBIがハッキングされたMicrosoft Exchangeサーバーのバックドアを塞ぐ作戦を実行
セキュリティ
2021-04-15 16:30
【コラム】自動運転車の普及にはまず運転支援システムが消費者に信頼されることが必要
モビリティ
2021-08-01 01:49
材料研究を効率化するプラットフォーム開発するのイスラエルMaterials Zoneが約6.5億円を調達
ソフトウェア
2021-04-29 05:02
進むAI-OCR活用、電子文書とRPAの自動化が生み出す成果
IT関連
2022-10-18 03:34
「Microsoft Exchange Server」の脆弱性を悪用したハッキング、3万の米組織に影響の恐れ
IT関連
2021-03-08 10:08
DeepL クテロフスキーCEOが語るAIの今後と課題–責任ある利用を重視
IT関連
2023-05-17 03:55
AWSが“駆け出し”のCTOを支援する新たなプログラム
IT関連
2022-05-28 11:19