AIモデルの「ロングコンテキストウィンドウ」とは?

今回は「AIモデルの「ロングコンテキストウィンドウ」とは?」についてご紹介します。

関連ワード (CIO/経営等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 テレビシリーズを一気見するとき、一度に1エピソード分しか覚えていられないとしよう。次のエピソードに移ると、さっき見たものを一瞬ですべて忘れてしまう。では、その番組で見たすべてのエピソード、すべてのシーズンを覚えていられるとしよう。今度はストーリー、登場人物、紆余曲折を把握できる。

 人工知能(AI)モデルの話では、一度に1エピソードしか記憶できず、次のエピソードに移ると強制的に忘れさせられることが「ショートコンテキストウィンドウ」に当たる。シリーズのすべてのエピソードを覚えていられることが、コンテキストが大きいAIモデル、すなわち「ロングコンテキストウィンドウ」に当たる。

 つまり、ロングコンテキストウィンドウとは、モデルが同時に多くの情報を覚えていられるということだ。

 ロングコンテキストウィンドウについて、そしてボットなどのシステムのパフォーマンスへの影響についてさらに知るには、AIにおける「コンテキスト」を理解する必要がある。

 「ChatGPT」、チャットボットの「Gemini」「Microsoft Copilot」などのAIシステムは、AIモデル(それぞれ「GPT-3.5」「Gemini」「GPT-4」)をベースとして構築されている。モデルは知識を保持し、対話中の情報を記憶し、質問に適切に応答するなど、システムの「頭脳」として機能する。

 AIにおけるコンテキストとは、AIがいま処理しているデータに意味と関連度を与える情報を指す。モデルが判断や応答生成の際に考える情報だ。

 コンテキストはトークンという単位で測られ、コンテキストウィンドウは、モデルが一度に考慮できる(扱える)トークンの最大数を表す。各トークンは言語にもよるが、単語だったり単語の一部であったりする。英語の場合、1トークンは1単語であることが多く、GPT-4のようなAIモデルは、トークンウィンドウが1万6000(16k)トークンだと、およそ1万2000単語を扱える。

 1万2000単語を扱えるAIチャットボットであれば、3000単語の記事や5000単語の論文を要約した上で、ユーザーが読み込ませたその文書の内容を忘れることなく、追加の質問に答えることができる。対話全体を通じて、それまでに伝えたメッセージのトークンも加味され、ボットは話されている内容の文脈(コンテキスト)を理解する。

 したがって、対話がトークン数の上限以下に収まっていれば、AIチャットボットはすべてのコンテキストを保持できる。しかし、トークン数の上限を超えると、トークンウィンドウ以内に収めるために、最初の方のトークンは無視されたり失われたりする可能性が高く、ボットは文脈を見失うことになるかもしれない。

 「Gemini 1.5 Pro」の100万トークンという巨大なトークンウィンドウをGoogleが誇らしげに宣伝するのはこのためだ。Googleの最高経営責任者(SEO)Sundar Pichai氏によると、コンテキストウィンドウが100万トークンならば、チャットボット「Gemini Advanced」でコードなら3万行以上、PDFファイルなら最大1500ページ、Cheesecake Factoryのメニューなら96冊を処理できるという。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
共創空間「NEC Future Creation Hub」の現在地点–最新技術を体感
IT関連
2022-06-10 16:30
コンテンツ制作者の79%が燃え尽き症候群を経験–Tasty Edits調査
IT関連
2023-08-15 01:59
「Nutanix Clusters on Azure」正式リリース。これでAWSとAzureとオンプレミスのマルチクラウド/ハイブリッドクラウド対応に
Microsoft Azure
2022-10-18 12:20
LinkedIn、インタラクティブなClubhouseスタイルの音声イベント機能を2022年1月開始、動画版は今春登場予定
IT関連
2022-01-18 22:34
AIで心を癒すあなただけのアロマを調合、コードミーが「香りのトータルコーディネート」など新展開
その他
2021-06-18 10:48
農機具と生産者のマッチングや修理・買取を支援する農機具流通サービス「ノウキナビ」が1.9億円調達
ネットサービス
2021-02-17 22:29
TSIホールディングス、30以上のブランドEC基盤を「Shopify」で統合へ
IT関連
2024-08-31 17:12
ポーラ・オルビスとANAによるCosmoSkinプロジェクトが開発中のスキンケア化粧品、JAXAの生活用品アイデア募集に選定
IT関連
2022-03-24 19:20
CIAのプログラムが米市民の情報を大量収集か–米議員が透明性求める
IT関連
2022-02-16 09:03
“バイトテロ”再び 8年で変質した炎上の背景を考える :小寺信良のIT大作戦(1/2 ページ)
トップニュース
2021-06-24 10:22
ゲーミフィケーションを活用したコネクテッドローイングマシンのErgattaが約32.8億円を調達
ヘルステック
2021-05-02 21:02
クラウドフレアのCEOに聞く、大規模障害の背景や地政学的リスクへの対応
IT関連
2022-10-06 15:40
WHIとサイダス、新製品「COMPANY Talent Management」を提供–日本企業向けに使いやすさなど追求
IT関連
2024-11-16 04:44
AWS、無料のアプリ開発トレーニングシリーズ–Twitchで毎週配信
IT関連
2021-02-03 08:38