Fastly、生成AIのAPIをインテリジェントにキャッシュ、高速レスポンスとコール回数削減を実現する「AI Accelerator」発表

今回は「Fastly、生成AIのAPIをインテリジェントにキャッシュ、高速レスポンスとコール回数削減を実現する「AI Accelerator」発表」についてご紹介します。

関連ワード (以前、対応、発表等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、Publickey様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


Fastlyは、生成AIへのAPIコールをセマンティックに基づいてインテリジェントにキャッシュすることで、APIコールからの高速なレスポンスとAPIコール回数の低減によるコスト削減などを実現する「Fastly AI Accelerator」を発表しました。

fig

インテリジェントなセマンティックキャッシング

通常のアプリケーションが提供するAPIは、引数と返値が文字列や数値などのデータ型によって決められています。そのため、APIキャッシュのアルゴリズムにおいて引数が一致しているかどうかを判断し、一致している場合にはキャッシュ済みの返値を高速に返す、といった処理はそれほど複雑なものではありません。

一方で、最近登場した生成AIにおいては、プロンプトが自然言語で記述されるため、ほとんど同じ内容であったとしてもさまざまな表記や表現が可能なため、プロンプトが過去のプロンプトと完全に一致することは期待できません。

今回発表されたFastly AI Acceleratorは、インテリジェントなセマンティックキャッシングによって、こうした生成AIに対するAPIコールでも有効性を発揮できるようにつくられた生成AI用のAPIキャッシュおよびゲートウェイです。

以前に質問されたことのある類似のプロンプトについて、セマンティックキャッシュによってキャッシュされたレスポンスを高速に返すことで、生成AIを用いたアプリケーションの性能向上と、APIコール数の低減によるコスト削減を実現します。

ChatGPTのテキストAPIから対応開始

Fastly AI Acceleratorは、OpenAIのChatGPTが提供するテキストAPIのAPIゲートウェイ機能をまず提供します。開発者は新しいAPIエンドポイントを使用するようにアプリを更新するだけで利用を開始できます。

Fastlyは今後、OpenAI以外の生成AIにも対応を広げていくとしています。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
Instagram、クリエイターの収益化を強化 ライブで100ドル以上支給も
アプリ・Web
2021-06-10 09:20
AI導入企業でもガバナンス対応に課題–PwCが日本企業のAI活用を調査
IT関連
2021-04-05 01:32
電通のグループ横断組織、メタバース活用を支援する新ソリューション
IT関連
2022-05-27 20:27
[速報]JavaOneが復活、今年10月にラスベガスで開催。2017年以来5年ぶり
Java
2022-03-23 12:36
ブロックチェーンやIoT、AI活用でワクチンのサプライチェーン強化へ–IT企業の取り組み
IT関連
2021-01-28 21:28
Twitter、1アカウントでの複数ペルソナ切り替えなど、3つの機能を検討中
アプリ・Web
2021-07-03 05:06
「今は成長か停滞かの重要な分岐点」と話す日本IBM社長の思いとは
IT関連
2024-07-20 14:51
SBTと龍谷大学、農業データを一元管理するデータ分析基盤を開発
IT関連
2023-04-06 15:20
こんな場所にも浸透? あなたの知らない“生体認証”の世界
PR
2021-03-11 16:59
練馬区、未納対策業務にAIを活用–富士通Japanと共同開発
IT関連
2024-03-30 09:19
米国の空港で進む顔認識のテスト–過去には議員らが懸念を表明
IT関連
2023-05-17 02:17
中国政府の要求を満たす最強の「検閲クラウド」の実力とは
IT関連
2023-03-04 10:59
電帳法改正にどう対応するか(後編)–検討における4つのステップ
IT関連
2022-03-25 13:31
NEC、「プラスチック情報流通プラットフォーム」のプロトタイプを開発
IT関連
2024-03-01 22:49