Fastlyが「AI Accelerator」正式リリース、生成AIからのレスポンスをキャッシュし高速化とコスト削減を実現

今回は「Fastlyが「AI Accelerator」正式リリース、生成AIからのレスポンスをキャッシュし高速化とコスト削減を実現」についてご紹介します。

関連ワード (対応、正式、通常等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、Publickey様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


Fastlyは、生成AIへのAPIコールに対するレスポンスをセマンティックに基づいてインテリジェントにキャッシュすることで、高速なレスポンスとAPIコール回数の低減によるコスト削減などを実現する「Fastly AI Accelerator」の正式リリースを発表しました。

fig

生成AIをAPI経由で呼び出す場合、通常のサービスの呼び出しと比較するとレスポンスまでに時間がかかることが多く、呼び出しごとにかかる料金も高額になりがちです。

Fastly AI Acceleratorは、こうした生成AIからのレスポンスをキャッシュし、似たような質問に対するレスポンスであればキャッシュの内容を高速に返すことで、生成AIのレスポンスを高速にし、また呼び出しにかかるコストを削減できると説明されています。

キャッシュは「セマンティックキャッシュ」として、呼び出しの内容をベクトルとして保持するため、似たような意味を持つ呼び出し内容であればキャッシュが利用される仕組みとなっています。

同社はFastly AI Acceleratorのベータ版の利用実績として、応答速度が平均で9倍高速になったとしています。

Fastly AI AcceleratorはOpenAI ChatGPTに加え、 Microsoft Azure AI Foundryにも対応しています。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
運輸・海運業界を狙うランサムウェアが増加、世界情勢が影響の可能性–Trellixの脅威レポート
IT関連
2022-12-06 16:03
マイクロソフトが買収したコンテナ最適化Linuxの「Flatcar Container Linux」、CNCFのインキュベーションプロジェクトに採択
Docker
2024-11-07 17:45
Facebook、オーストラリアでのニュース共有制限解除 法案修正で合意
企業・業界動向
2021-02-25 05:46
GitHubのAIプログラミングツール「Copilot」、プレビュー版が提供開始
IT関連
2021-06-30 12:02
欧州のReventが気候・健康・インパクトに特化したファンドで約78億円のハードキャップを達成
IT関連
2022-02-24 11:26
AWSはなぜ「ユーザー視点のパートナー認定制度」に注力するのか
IT関連
2021-03-25 00:02
Instagramはクリエイターの生活のためにアフィリエイトとショップ機能を導入
ネットサービス
2021-06-11 17:02
日立、DXの旗艦拠点「Lumada Innovation Hub Tokyo」を開設–元日本MS澤氏がエバンジェリスト就任
IT関連
2021-03-23 12:28
[速報]AWS、SPARCサーバを仮想化してAWSに載せる「Virtualization for SPARC on AWS with Stromasys」発表。AWS re:Invent 2023
AWS
2023-11-29 02:08
機械学習モデルの作成とメンテナンスを支援するCometがシリーズAで14.1億円調達
人工知能・AI
2021-04-15 21:30
マイクロソフト、「Copilot in OneDrive」を5月に提供開始へ
IT関連
2024-02-08 12:35
グーグル、広告ビジネスをめぐるテキサス州の反トラスト法訴訟で棄却を要請
IT関連
2022-01-23 08:39
京セラベトナム、AR活用し現場教育と安全管理–ノウハウも伝承
IT関連
2025-02-01 09:47
Snowflakeが推進する「データクリーンルーム」–プライバシーを保護しながらデータ共有・活用
IT関連
2023-06-08 01:41