Fastlyが「AI Accelerator」正式リリース、生成AIからのレスポンスをキャッシュし高速化とコスト削減を実現

今回は「Fastlyが「AI Accelerator」正式リリース、生成AIからのレスポンスをキャッシュし高速化とコスト削減を実現」についてご紹介します。

関連ワード (対応、正式、通常等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、Publickey様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


Fastlyは、生成AIへのAPIコールに対するレスポンスをセマンティックに基づいてインテリジェントにキャッシュすることで、高速なレスポンスとAPIコール回数の低減によるコスト削減などを実現する「Fastly AI Accelerator」の正式リリースを発表しました。

fig

生成AIをAPI経由で呼び出す場合、通常のサービスの呼び出しと比較するとレスポンスまでに時間がかかることが多く、呼び出しごとにかかる料金も高額になりがちです。

Fastly AI Acceleratorは、こうした生成AIからのレスポンスをキャッシュし、似たような質問に対するレスポンスであればキャッシュの内容を高速に返すことで、生成AIのレスポンスを高速にし、また呼び出しにかかるコストを削減できると説明されています。

キャッシュは「セマンティックキャッシュ」として、呼び出しの内容をベクトルとして保持するため、似たような意味を持つ呼び出し内容であればキャッシュが利用される仕組みとなっています。

同社はFastly AI Acceleratorのベータ版の利用実績として、応答速度が平均で9倍高速になったとしています。

Fastly AI AcceleratorはOpenAI ChatGPTに加え、 Microsoft Azure AI Foundryにも対応しています。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
日本でも徐々に広がり出したDevSecOps–GitLabに聞く、現状とこれから
IT関連
2025-03-28 07:41
「ChatGPT」を使用して「Excel」の数式を作成するには
IT関連
2023-04-23 06:24
AI時代に必要となる能力–技術スキルとともに重視されるヒューマンスキル
IT関連
2024-06-29 14:18
キーサイトの寺澤新社長が就任会見、AIや半導体への取り組みを加速
IT関連
2024-08-04 23:17
OpenAI、「OpenAI Pioneers Program」を開始–業界特化のAIベンチマークを推進
IT関連
2025-04-12 15:21
自分に最適な「Linux」デスクトップディストリビューションを選ぶには
IT関連
2023-04-14 05:12
データはあるのに分散していて活用できない! “宝の持ち腐れ”解消に向け現場の技術者がとった手段
PR
2021-08-04 03:28
オラクル、同僚同士でたたえ合う新機能–「分かってもらえる安心感」を醸成
IT関連
2023-09-27 20:53
1000ノード超のデータ分析基盤はクラウドでも安定稼働–テラデータがAWSで実証
IT関連
2022-03-12 00:46
セールスフォースの「Data Cloud」、データ活用のための「ラストワンマイル」を支援
IT関連
2024-09-07 06:09
青色LEDの光で発電する太陽電池、無線給電に活用 東京都市大が新技術
企業・業界動向
2021-02-11 18:09
「つなぐチカラ」で社会課題の解決と持続的成長に貢献–KDDI・高橋社長
IT関連
2023-01-06 04:13
アマゾン、時価総額が1兆ドル下落
IT関連
2022-11-12 04:02
人口1万7000人の町からテクノロジーで世界展開を狙う、農業用収穫ロボット開発のAGRISTが資金調達
ロボティクス
2021-03-04 00:36