Fastly、生成AIのAPIをインテリジェントにキャッシュ、高速レスポンスとコール回数削減を実現する「AI Accelerator」発表

今回は「Fastly、生成AIのAPIをインテリジェントにキャッシュ、高速レスポンスとコール回数削減を実現する「AI Accelerator」発表」についてご紹介します。

関連ワード (以前、対応、発表等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、Publickey様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


Fastlyは、生成AIへのAPIコールをセマンティックに基づいてインテリジェントにキャッシュすることで、APIコールからの高速なレスポンスとAPIコール回数の低減によるコスト削減などを実現する「Fastly AI Accelerator」を発表しました。

fig

インテリジェントなセマンティックキャッシング

通常のアプリケーションが提供するAPIは、引数と返値が文字列や数値などのデータ型によって決められています。そのため、APIキャッシュのアルゴリズムにおいて引数が一致しているかどうかを判断し、一致している場合にはキャッシュ済みの返値を高速に返す、といった処理はそれほど複雑なものではありません。

一方で、最近登場した生成AIにおいては、プロンプトが自然言語で記述されるため、ほとんど同じ内容であったとしてもさまざまな表記や表現が可能なため、プロンプトが過去のプロンプトと完全に一致することは期待できません。

今回発表されたFastly AI Acceleratorは、インテリジェントなセマンティックキャッシングによって、こうした生成AIに対するAPIコールでも有効性を発揮できるようにつくられた生成AI用のAPIキャッシュおよびゲートウェイです。

以前に質問されたことのある類似のプロンプトについて、セマンティックキャッシュによってキャッシュされたレスポンスを高速に返すことで、生成AIを用いたアプリケーションの性能向上と、APIコール数の低減によるコスト削減を実現します。

ChatGPTのテキストAPIから対応開始

Fastly AI Acceleratorは、OpenAIのChatGPTが提供するテキストAPIのAPIゲートウェイ機能をまず提供します。開発者は新しいAPIエンドポイントを使用するようにアプリを更新するだけで利用を開始できます。

Fastlyは今後、OpenAI以外の生成AIにも対応を広げていくとしています。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
日本ハムら、豚の発情検知サービスを提供–判定作業が約8割減
IT関連
2022-10-07 13:56
PCの数と資産台帳の数字が合わない–そこに潜む根深い原因
IT関連
2023-02-14 15:45
メンタルヘルスの服薬管理に特化したテレヘルス管理プラットフォーム「Minded」が約28.7億円を調達
IT関連
2022-02-24 01:50
クラウドフレア・ジャパン新社長が自らの経験から語った「日本法人の役割」
IT関連
2022-03-26 04:30
業務全体の効率化で取り入れる並行化とコレオグラフとは何か
IT関連
2022-07-20 06:25
HPE国内売り上げの2割が「GreenLake」に–2023会計年度の事業戦略
IT関連
2022-12-11 12:08
eコマースの広告効果アップを目指すShopalystが新プラットフォーム立ち上げ
ネットサービス
2021-01-31 12:50
リコーが3Dコンテンツを全方位立体映像として現実空間に映し出せる投影装置を開発、裸眼で視認可能
ハードウェア
2021-03-09 12:52
今もなお残るリモートワークに対する勘違い
IT関連
2022-12-16 14:07
IoTスタートアップobnizの通信ゲートウェイが東京都のコロナ自宅療養者向けパルスオキシメーター監視システムに採用
IT関連
2022-02-08 03:07
ビックカメラがクラウドストレージサービス 月額500円でスマホ版は容量無制限
クラウドユーザー
2021-03-02 02:27
IPv6エンジニア育成を推進する「IPv6基礎検定」が2023年3月より通年実施、小川晃通氏著「プロフェッショナルIPv6第二版」が主教材
IT関連
2022-03-25 22:09
超新星爆発の謎解明 ニュートリノが衝撃波を加速 
IT関連
2021-04-24 04:27
AIが候補者を抽出、異動先を提案 NEC子会社が自治体向けに開発
DX
2021-04-22 21:27