「Amazon Bedrock」が生成AIのコストを最大90%節約できるプロンプトキャッシングなど新機能を搭載

今回は「「Amazon Bedrock」が生成AIのコストを最大90%節約できるプロンプトキャッシングなど新機能を搭載」についてご紹介します。

関連ワード (予測、適切、開始等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、Publickey様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


Amazon Web Services(AWS)は、米ラスベガスで開催中のイベント「AWS re:Invent 2024」の基調講演で、生成AIの基盤モデルをマネージドサービスで提供するAmazon Bedrockの新機能として、プロンプトのコンテキストをキャッシュする機能や、プロンプトを適切なモデルへルーティングする機能などを発表しました。

コンテキストを再利用してコストとレイテンシを低減

プロンプトキャッシングは、Bedrock上の複数のモデルに対してよく使用されるプロンプトのコンテキストをキャッシュする機能です。キャッシュは最大5分間有効とされています。

Amazon Bedrock Prompt Caching

例えば同一のドキュメントに対して繰り返しプロンプトで質問されるケースや、プログラマがずっと同じコードに対してコードアシスタントを使用するケースなど、似たようなコンテキストが繰り返し使用されるケースでは、キャッシュされた内容を再利用できるため、最大でコストが90%、レイテンシが85%削減されると説明されています。

プロンプトに応じて適切なモデルを選択

インテリジェントプロンプトルーティングは、プロンプトの複雑さに応じて基盤モデルのファミリーの中からコストと品質が最適なモデルを選び、そのモデルにプロンプトを送り込むことができる機能です。

Amazon Bedrock Intelligent Prompt Routing

プロンプトのルーターはプロンプトに応じて、どのモデルがコストと品質の面でどのモデルが最適化を予測する能力を備えており、例えばAnthropicのClaudeモデルファミリーには、Opus、Sonnet、Haikuと呼ばれるコストと能力が異なる3つのモデルがあり、Amazon Bedrockはプロンプトの複雑さに応じてSonnetとHaikuのいずれかに対してインテリジェントにプロンプトをルーティングできます。

ルーティングは、複雑でないプロンプトは小さくレスポンスが速くコストの安いモデルで処理し、複雑なプロンプトは能力の高いモデルで処理するように行われます。

これによりプロンプトに対する回答の精度を犠牲にすることなく、コストを最大で30%削減できると説明されています。

そのほかAmazon Bedrockは、構造化データの取得機能、グラフRAGへの対応、マルチモーダル対応のデータ抽出機能、エージェント作成機能など、多数の機能追加が発表されました。

Amazon Bedrock

AWS re:Invent 2024バックナンバー

  • AWS、WebアプリからAmazon S3にアクセスできるUIコンポーネント「Storage Browser for S3」正式リリース
  • AWS、ノーコードでAmazon S3を操作するWebアプリが作れる「AWS Transfer Family web apps」発表
  • AWS上にOracle Cloudを持ち込んだ「Oracle Database@AWS」、限定プレビューの申し込みを開始
  • AWS、VMware社ではなくAWS自身が提供する「Amazon Elastic VMware Service」プレビュー公開
  • [速報]「Amazon Aurora DSQL」プレビュー公開、事実上無限にスケールする高性能なPostgreSQL互換の大規模分散データベース
  • [速報]Amazon、自社開発の基盤モデル「Amazon Nova」発表。テキストから画像や動画の生成、マルチモーダルまで対応
  • [速報]コーディング支援AIのAmazon Q Developer、新機能としてユニットテストの生成、コードからドキュメント生成、コードレビューなど追加
  • AWS、生成AIのトレーニングに最適化した独自プロセッサ「AWS Trainium3」発表。Trainium2の2倍の性能に
  • AWS、100以上の生成AIの基盤モデルが選べる「Amazon Bedrock marketplace」発表
  • 「Amazon Bedrock」が生成AIのコストを最大90%節約できるプロンプトキャッシング機能など新機能を搭載

COMMENTS


Recommended

TITLE
CATEGORY
DATE
HashiCorp、「HCP」日本リージョンの一般提供を発表–対象サービスは「Vault」「Consul」
IT関連
2022-08-05 01:29
日本経済新聞社、オラクルのクラウドERPを導入–経理・財務領域のDXを加速
IT関連
2022-05-17 11:40
日立製作所とNVIDIAが生成AIで協業–AIソリューション「Hitachi iQ」を共同開発へ
IT関連
2024-03-20 10:34
マイクロソフト、オラクル、セールスフォースがコロナ予防接種情報を記録するプロジェクトで協力
IT関連
2021-01-19 04:52
GitHub CEO トーマス・ドムケ氏が来日。いずれコードの80%がAIで作成されるようになると予言
GitHub
2022-12-07 22:47
ネット被害、裁判迅速化へ 地方の負担軽減は不透明
IT関連
2021-01-14 21:40
mineo、月間20GBで1750円の新プラン 「現行から最大60%値下げ」
IT関連
2021-01-28 10:47
Javaのネイティブバイナリ生成可能なGraalVMの全機能が無料に、最適化コンパイラやG1ガベージコレクションを含む。本番環境でも利用可能
GraalVM
2023-06-15 10:27
CTCSP、会員制ECサイト「ECSPice」を開設へ–クラウドサービスなど販売
IT関連
2022-11-23 07:17
カウンセリングなど対人援助のオンライン相談室を開設できる「ソラハル Client First」のソラハルが1500万円調達
ヘルステック
2021-07-22 02:39
サイバー攻撃の標的は、パスワードよりも「認証後の証明」へ移ろうとしている。アイデンティティ管理のOktaはなぜ狙われ、どう対策していくのかを聞いた[PR]
PR
2024-03-26 21:51
NRI、リテール証券会社向けバックオフィスシステムを「OCI Dedicated Region」で稼働
IT関連
2023-04-21 21:30
「LINE対面占い」開始 占い師とビデオ通話で「密を避けられる」
ネットトピック
2021-06-11 11:12
ソフトバンクとアイリスオーヤマがロボット事業の合弁会社設立、AI除菌清掃ロボット「Whiz i アイリスエディション」発表
ロボティクス
2021-01-29 17:46