DeepSeek、最新のAIモデル「V3-0324」を発表

今回は「DeepSeek、最新のAIモデル「V3-0324」を発表」についてご紹介します。

関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 DeepSeekは米国時間3月25日、「DeepSeek-V3-0324」を正式に発表した。前日には「HuggingFace」に新モデルがアップロードされていたが、追加情報はほとんどなかった。

 「DeepSeek-R1」と同様に、新バージョンは、MITライセンスの下でオープンソースとして公開されている(公開されているのは、実際のコードではなく、モデルの重みのみ)。

 DeepSeekは「X」への投稿で、今回のアップデートでは、ウェブ開発におけるコーディングスキルと「推論性能の大幅な向上」が見られると述べた。しかし、同社はこのモデルをあまり複雑でない推論タスクに使うことを推奨している。R1は同社最高の推論モデルであり、「Chatbot Arena」で4位にランクインしている。

 DeepSeekは、このアップデートにより、幾つかの業界標準ベンチマークで「DeepSeek-V3」を上回るパフォーマンスを示したと述べた。特に、American Invitational Mathematics Examination(AIME)で20ポイント近く高いスコアを獲得している。

 ほとんどのモデルにとって、ベンチマークは簡単になりすぎている(ベンチマークの飽和)が、AIMEは依然として大半のベンチマークよりも難しいと考えられている。1月には、Scale AIとCenter for AI Safety(CAIS)が飽和に対抗するために「Humanity’s Last Exam」(HLE)をリリースした。

 とはいえ、AIMEは高校数学の内容に基づいているため、その解答はオンラインで公開されており、トレーニングデータに含まれる可能性がある。

 DeepSeekによると、その他の改良点としては、「強化された」ライティングスタイルや長文コンテンツにおける品質向上が挙げられる。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
京都市内5カ所にポケモンのマンホールふた 「ホウオウ」降臨、「ピチュー」「ピィ」も
くらテク
2021-03-31 03:49
気が散らないメッセージングアプリ「Quill」、どこからともなく現れSlackに迫る勢い
ネットサービス
2021-03-19 07:14
電気ポットからApple Watchまで、デジタルで緩やかな“みまもり”を :デジタル防災を始めよう(1/2 ページ)
トップニュース
2021-07-31 11:23
ラック、企業の生成AI活用を支援する新サービス–社内データを外部送信しないプライベート環境を構築
IT関連
2023-12-14 12:24
SCSK、ブレインズテクノロジーと協業–製造現場向けソリューションの強化図る
IT関連
2024-10-02 13:00
フェイスブックが開発途上国向けにInstagram Liteを提供、わずか2MBでAndroid版のみ
ネットサービス
2021-03-12 10:20
Google Cloudが次世代API管理プラットフォーム「Apigee X」を発表
ソフトウェア
2021-02-06 09:07
学研ココファン、業務デジタル化クラウドで業務帳票数を約85%削減
IT関連
2023-07-27 12:03
Facebook、新型コロナワクチン接種を支援するツール開発 Instagramスタンプも
アプリ・Web
2021-03-17 22:07
メルカリ、顧客情報など2万7000件以上流出 外部ツールへの不正アクセスで
セキュリティ
2021-05-22 20:22
「ChatGPT」のウェブ検索機能、ログインせず利用可能に
IT関連
2025-02-08 03:56
「freee会計」、「消費税申告ライト」を提供へ–インボイス対応の個人事業主向け機能
IT関連
2023-11-23 16:21
企業が推進するエッジ利用–効果的なデータ活用に課題
IT関連
2023-05-19 13:51
“CXネイティブ”のZendeskに聞く、生成AIで進化するカスタマーサービス
IT関連
2023-09-29 07:45