Fastly、生成AIのAPIをインテリジェントにキャッシュ、高速レスポンスとコール回数削減を実現する「AI Accelerator」発表

今回は「Fastly、生成AIのAPIをインテリジェントにキャッシュ、高速レスポンスとコール回数削減を実現する「AI Accelerator」発表」についてご紹介します。

関連ワード (以前、対応、発表等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、Publickey様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


Fastlyは、生成AIへのAPIコールをセマンティックに基づいてインテリジェントにキャッシュすることで、APIコールからの高速なレスポンスとAPIコール回数の低減によるコスト削減などを実現する「Fastly AI Accelerator」を発表しました。

fig

インテリジェントなセマンティックキャッシング

通常のアプリケーションが提供するAPIは、引数と返値が文字列や数値などのデータ型によって決められています。そのため、APIキャッシュのアルゴリズムにおいて引数が一致しているかどうかを判断し、一致している場合にはキャッシュ済みの返値を高速に返す、といった処理はそれほど複雑なものではありません。

一方で、最近登場した生成AIにおいては、プロンプトが自然言語で記述されるため、ほとんど同じ内容であったとしてもさまざまな表記や表現が可能なため、プロンプトが過去のプロンプトと完全に一致することは期待できません。

今回発表されたFastly AI Acceleratorは、インテリジェントなセマンティックキャッシングによって、こうした生成AIに対するAPIコールでも有効性を発揮できるようにつくられた生成AI用のAPIキャッシュおよびゲートウェイです。

以前に質問されたことのある類似のプロンプトについて、セマンティックキャッシュによってキャッシュされたレスポンスを高速に返すことで、生成AIを用いたアプリケーションの性能向上と、APIコール数の低減によるコスト削減を実現します。

ChatGPTのテキストAPIから対応開始

Fastly AI Acceleratorは、OpenAIのChatGPTが提供するテキストAPIのAPIゲートウェイ機能をまず提供します。開発者は新しいAPIエンドポイントを使用するようにアプリを更新するだけで利用を開始できます。

Fastlyは今後、OpenAI以外の生成AIにも対応を広げていくとしています。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
“アバター化”したコンシェルジュがリモートで観光案内 9月まで都庁内などで実証実験
DX
2021-06-15 01:08
日本株に今「強気」の理由–プロが実践、売り買いの3原則
IT関連
2021-04-07 19:33
帝人と富士通、独自転車メーカーとリサイクルを環境価値化したビジネスモデル構築
IT関連
2023-01-21 11:34
農産物の盗難をドローンで監視 赤外線カメラなどで不審者を空撮
DX
2021-07-15 06:45
「脱丸投げ」でERPなどのカスタマイズは2割未満に–ガートナーが提言
IT関連
2024-03-30 08:40
NianticのハンケCEO、「メタバースはディストピア。よりよい現実を構築しよう」
企業・業界動向
2021-08-16 16:30
「iPhone」で「Apple IDのセキュリティキー」を設定するには–手順と注意点
IT関連
2023-02-05 23:09
パーソルHD、システムを活用した社内スカウト制度の利用実績を公表
IT関連
2024-03-07 07:43
Celonis、「Sailfin Accounts Receivable」発表–AI活用でキャッシュフローと運転資本を改善
IT関連
2024-04-16 22:07
マスク氏はアップルのApp Store手数料を「インターネットにおける税」と呼ぶ
ネットサービス
2021-08-01 10:11
Google Cloud、AIエージェント構築「Vertex AI Agent Builder」など発表
IT関連
2024-04-12 13:37
【コラム】生体情報収集への道は善意で舗装されている
IT関連
2022-01-24 22:58
アンビエントコンピューティングとは–IoTとの違いやユースケースなどの基本を解説
IT関連
2022-10-13 18:46
NECら、SMBCグループ専用環境で「SMBC-GPT」実証へ–資料作成など支援
IT関連
2023-04-13 00:24