MS、小型AIモデル「Phi-3-mini」を発表–性能は「GPT-3.5」に匹敵

今回は「MS、小型AIモデル「Phi-3-mini」を発表–性能は「GPT-3.5」に匹敵」についてご紹介します。

関連ワード (CIO/経営等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 テクノロジー企業各社は、より大規模でより高性能な人工知能(AI)モデルの構築でしのぎを削っている。だが、小型モデルも依然として大きな価値を持っており、Microsoftはそのコンセプトに大きく賭けようとしている。

 Microsoftは米国時間4月23日、今後数カ月以内に3つの小型AIモデルをリリースすることを明らかにし、最初のモデルとして「Phi-3-mini」をリリースした。Phi-3-miniは、トレーニングに使用されたパラメーター(AIモデルがより優れた結果を生成するために使用する変数)数が38億と、計画されている3つのモデルの中で最も規模が小さい。同社は、トレーニング用パラメーター数が70億の「Phi-3-small」と140億の「Phi-3-medium」も発表したが、そのリリース時期は明言しなかった。

 パラメーター数について見てみると、OpenAIの「GPT-4 Turbo」については、1兆以上のパラメーターがトレーニングに使われていることが複数の報告で示唆されている。また、Metaは2024年内にリリースする「Llama 3」モデルの最終版について、700億のパラメーターでトレーニングする予定だと18日に述べていた。

 モデルのトレーニングに使われるパラメーターが増えるほど、ユーザーが望む結果を生成できる能力が高まるが、これには代償が伴う。AIモデルのパラメーターが増えれば、結果の生成に必要な電力やエネルギーも増えてしまう。クエリーが複雑な場合や、医療分野などでミッションクリティカルなAIを実装する場合は、パラメーターが多い方が適しているかもしれないが、必ずしもパラメーター数が多ければいいというわけではない。

 実際、Microsoftが発表したような小型のモデルは、スマートフォンなど低電力のデバイスに適している。Microsoftは、モバイルデバイスなど、搭載されるAIのパフォーマンスがチップセットの能力やバッテリー寿命によって制約されるデバイスで、「Phi-3」シリーズのAIを使用する可能性がある。

 MicrosoftはPhi-3-miniについて、小型ながら優れたパフォーマンスを発揮すると主張している。同社がThe Vergeの取材に対して語ったところによると、Phi-3-miniは同社が使用したパラメーターの10倍以上の数でトレーニングしたモデルに匹敵するパフォーマンスを実現しており、「GPT-4」やGPT-4 Turboには及ばないものの、GPT-3.5と同程度の能力があるという。

 また、このレベルのパフォーマンスを達成するために、児童書などを含む「カリキュラム」でPhi-3-miniをトレーニングしたと、MicrosoftはThe Vergeに対して述べている。さらに、教材の不足を補うために、より大規模なモデルを使ってAIで作成した児童書を使用したという。

 Microsoftは現在、クラウドプラットフォーム「Azure」、提携先のHugging Faceのサイト、およびAIモデルサービスを手がけるOllamaのサイトで、Phi-3-miniを無料公開している。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
中国生まれの音声ネットワーキングアプリ「Tiya」、国際的な事業展開を進めるべくシンガポールに本社を設立
IT関連
2022-02-12 14:20
米空軍が地球規模のロケット貨物輸送プログラムを計画中、SpaceX以外の民間企業も選択肢見込む
宇宙
2021-06-08 08:33
フジテック、保守現場にスマートグラス導入–情シス部門と密に連携
IT関連
2022-11-20 14:59
日本の国立研究所が電子契約に「Adobe Sign」を初導入 多言語対応などを評価
DX
2021-07-07 01:27
4~6月決算好調で日本株はPERで割安に–外国人による先物を使った空中戦停止
IT関連
2021-08-16 23:59
日本HP、新年度事業戦略を発表–Windows 11で「買い換えサイクル短縮を期待」
IT関連
2022-01-22 04:36
Canooが仕事や遊びに使える新電動ピックアップトラックを発表
モビリティ
2021-03-13 06:24
ボタンやドアに“触れない”オフィスビル登場 屋上に“テレワーク”設備も
社会とIT
2021-01-20 19:01
NTTデータ社長が「1年先から始まる次期中期経営計画」に言及した理由
IT関連
2021-05-28 05:14
データセンターの膨大な電力需要を補うための液浸冷却技術にマイクロソフトが参入
ハードウェア
2021-04-18 12:50
Appleマップ、「評価および写真の紹介」提供開始でGoogle対抗 食べログ掲載店などユーザーが独自評価
IT関連
2021-04-24 08:45
センサーシールを皮膚に貼って「アルコール、カフェイン、ブドウ糖、乳酸、血圧、心拍数」を同時計測 :Innovative Tech
トップニュース
2021-03-21 22:07
クラウドベースの“汎用原子シミュレーター” PFNの深層学習モデルで数万倍の高速計算
クラウドユーザー
2021-07-09 00:04
グーグル、マネージド機械学習プラットフォーム「Vertex AI」を一般提供
IT関連
2021-05-21 12:38