富士通、対話型生成AIの幻覚やAIをだます攻撃に対処する新技術を開発

今回は「富士通、対話型生成AIの幻覚やAIをだます攻撃に対処する新技術を開発」についてご紹介します。

関連ワード (ビッグデータ等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 富士通は9月26日、「ChatGPT」をはじめとする対話型生成AIから出力される回答の信頼性を向上する新技術を発表した。国内の法人/個人向けに実証環境を順次提供し、グローバルにも順次展開する予定だ。

 現在、ChatGPTのように、大量のテキスト情報を学習し幅広いトピックで自然にやりとりできる対話型生成AIが注目を集め、多くの企業が業務適用に向けて検討を進めている。その一方で、高い対話品質やセキュリティ面での信頼性の確保が課題になっていると同社は説明する。

 富士通は今回、信頼できる対話型生成AIを実現する技術の第1弾として、「幻覚(ハルシネーション)検出技術」「フィッシングURL検出技術」を開発し、「Fujitsu Kozuchi(code name)- Fujitsu AI Platform」の対話型生成AIコアエンジンに搭載した。幻覚検出技術は9月28日、フィッシングURL検出技術は10月から国内向けに提供を開始する。個人の利用者は「Fujitsu Research Portal」上でアカウントを作成すればトライアルが可能になる。

 幻覚検出技術は、対話型生成AIがデータに基づかないもっともらしい誤りを回答してしまうハルシネーションを検出する技術で、対話型生成AIの回答文をAIが意味解析し、かつハルシネーションが生じやすい固有表現部分を特定して重点的に確認することで、既存手法よりも高精度に検出する。

 同社によると、対話型生成AIでは幻覚は固有名詞や数値などの固有表現の部分で生じやすく、質問のたびに回答内容が変化しやすい傾向を踏まえ、ハルシネーションが生じやすい箇所を特定して重点的に確認する技術を開発した。

 具体的には、回答文を主語、述語、目的語などに分解し、その中の固有表現部分を特定し、かつそこを空欄にして尋ねる穴埋め質問を自動で作成して外部の対話型生成AIに複数回質問することで、固有表現部分の回答のばらつきをより正確に捉え高精度な幻覚スコアの算出を実現するとしている。

 対話型生成AIは学習した情報に基づいて応答するため、攻撃者によって学習データに悪意のあるデータを混入させられると、利用者に有害な情報を提供してしまう問題がある。特に偽のウェブサイトに誘導するフィッシング攻撃は、さまざまなサイバー攻撃の初期手口として最も多く使用され、誤って偽のサイトにIDやパスワードなどの情報を入力すると企業全体の脅威にさらされる可能性がある。

 そこで富士通は、対話型生成AIの回答文に含まれるURL情報がフィッシングURLかどうかを判定して利用者に画面上で提示する技術を開発した。同技術は、フィッシングURLを特定するだけでなく、近年問題視されているAIの判断を故意に誤らせる既存の敵対的攻撃にも対応することで、信頼性の高い判定を実現しているという。

 イスラエルのネゲヴ・ベングリオン大学に設置された富士通スモールリサーチラボで共同開発した技術を活用しており、AIへの攻撃がそれぞれ個別のAIモデルに向けて特化しやすい傾向を利用し、複数の異なる種類のAIモデルで処理することで生じる判定根拠の違いから攻撃データを見分けている。対話型生成AIに限らず、帳票データを扱うAIに対する全般的な攻撃への対策にも活用が期待できるとしている。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
生成AIで盛り上がる半導体市場、日本企業も活躍
IT関連
2023-06-06 04:52
これからのデータ保護に必要なソリューションは何か–キーワードは「BSMA」
IT関連
2023-03-10 15:33
Slackはテキストベース以上のプラットフォームになろうとしている、オーディオとビデオ機能追加を検討
ネットサービス
2021-03-30 12:44
MongoDB、暗号化したままのデータベースを検索「Queryable Encryption」発表。データ格納時、メモリ上、データ転送、ログ、バックアップのすべてが暗号化データのまま
MongoDB
2022-06-15 08:59
コンピューター技術者を目指す若者にまずは学位を取らせるEdTech「Edge Pathways」
EdTech
2021-03-20 19:18
TikTokがTwitter、Instagramに続き有料サブスク導入を限定テスト、クリエイターの収益化の道を探る
IT関連
2022-01-22 00:47
楽天市場や楽天Payが一時利用できず、機器の不具合で 現在は解消
ネットトピック
2021-05-04 07:44
脱炭素化は分散するバリューチェーンの接続が必要–AIを展開するアスペンテック
IT関連
2024-06-18 06:49
若手研究者と共同創業するHERO Impact Capitalが1号ファンドを組成し投資活動開始、ファンド規模は30億円
IT関連
2022-02-26 21:26
サイバー犯罪のプロフェッショナル化–ウィズセキュア調査
IT関連
2023-05-27 10:22
ランサムウェアの脅威が後退傾向–Trellixの脅威レポート
IT関連
2022-08-06 06:37
Flipkartがインドの5000店舗の小売店と提携し特典プログラム強化、支払いにも使える「SuperCoin Pay」発表
フィンテック
2021-01-20 19:42
アンドパッド、「数年先の設計・施工DX」に先行し取り組む住宅実験プロジェクトANDPAD HOUSE検証発表
IT関連
2022-02-26 11:37
世界中の組織の90%が2年以内にITスキル不足の危機で痛手を感じ、製品の遅延、競争力の低下などを引き起こす。IDCが予測
働き方
2024-06-07 01:50