Fastly、生成AIのAPIをインテリジェントにキャッシュ、高速レスポンスとコール回数削減を実現する「AI Accelerator」発表

今回は「Fastly、生成AIのAPIをインテリジェントにキャッシュ、高速レスポンスとコール回数削減を実現する「AI Accelerator」発表」についてご紹介します。

関連ワード (以前、対応、発表等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、Publickey様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


Fastlyは、生成AIへのAPIコールをセマンティックに基づいてインテリジェントにキャッシュすることで、APIコールからの高速なレスポンスとAPIコール回数の低減によるコスト削減などを実現する「Fastly AI Accelerator」を発表しました。

fig

インテリジェントなセマンティックキャッシング

通常のアプリケーションが提供するAPIは、引数と返値が文字列や数値などのデータ型によって決められています。そのため、APIキャッシュのアルゴリズムにおいて引数が一致しているかどうかを判断し、一致している場合にはキャッシュ済みの返値を高速に返す、といった処理はそれほど複雑なものではありません。

一方で、最近登場した生成AIにおいては、プロンプトが自然言語で記述されるため、ほとんど同じ内容であったとしてもさまざまな表記や表現が可能なため、プロンプトが過去のプロンプトと完全に一致することは期待できません。

今回発表されたFastly AI Acceleratorは、インテリジェントなセマンティックキャッシングによって、こうした生成AIに対するAPIコールでも有効性を発揮できるようにつくられた生成AI用のAPIキャッシュおよびゲートウェイです。

以前に質問されたことのある類似のプロンプトについて、セマンティックキャッシュによってキャッシュされたレスポンスを高速に返すことで、生成AIを用いたアプリケーションの性能向上と、APIコール数の低減によるコスト削減を実現します。

ChatGPTのテキストAPIから対応開始

Fastly AI Acceleratorは、OpenAIのChatGPTが提供するテキストAPIのAPIゲートウェイ機能をまず提供します。開発者は新しいAPIエンドポイントを使用するようにアプリを更新するだけで利用を開始できます。

Fastlyは今後、OpenAI以外の生成AIにも対応を広げていくとしています。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
NEC、新型コロナの情報管理システムにRPA活用–登録業務の効率化を実証
IT関連
2021-03-04 22:28
仏政府、Googleに5億ユーロ(約650億円)の制裁金 記事スニペット表示関連で
企業・業界動向
2021-07-15 15:27
ケニア中央銀行がデジタル通貨の導入について国民から意見を募集
IT関連
2022-02-16 20:43
AWSが新CEOの就任を発表。6月3日付でMatt Garman氏に、Adam Selipsky氏は退任
AWS
2024-05-15 04:03
全高75cm、口からミストを噴射する「マジンガーZ」を作る本 アシェットが創刊
くらテク
2021-02-05 20:28
「Firefox 91」がリリース–Cookie削除機能の強化でプライバシー向上
IT関連
2021-08-12 10:50
ソフマップ、中古品買い取りアプリ「ラクウル」運営でブックオフと協業 買った物品をBOOKOFFで販売
ネットトピック
2021-06-20 21:04
北朝鮮の攻撃グループ、韓国の原子力研究機関にハッキング攻撃か
IT関連
2021-06-22 01:03
日立ソリューションズ、「PointInfinity」を拡張–デジタルマーケティングを包括的に支援
IT関連
2021-02-19 12:12
地域通貨でファンの応援を可視化–スポーツを通じた地域創生を支援
IT関連
2021-02-03 00:30
アップルが詐欺撲滅を目指してApp Storeガイドラインを改訂
ソフトウェア
2021-06-09 04:03
“バイトテロ”再び 8年で変質した炎上の背景を考える :小寺信良のIT大作戦(1/2 ページ)
トップニュース
2021-06-24 10:22
ユーザーからの激しい批判を受けWhatsAppがプライバシー規約更新についてのアプリ内バナー公開
ネットサービス
2021-02-21 05:51
MILIZEと三井住友信託銀行、文章・単語検索を効率化するエンジンを開発
IT関連
2022-11-12 14:18