NTTと早大、誤った正規表現の文字列抽出を自動で修正する技術を発表

今回は「NTTと早大、誤った正規表現の文字列抽出を自動で修正する技術を発表」についてご紹介します。

関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 NTTと早稲田大学は6月16日、誤った正規表現の文字列抽出を検出して自動的に修正する技術を世界で初めて実現したと発表した。同17~22日に開催される「PLDI2023」で詳細を報告するという。

 今回開発した技術は、多様なバリエーションを扱うことからあいまいさのない正確な記述が求められる正規表現の文字列抽出において、誤った記述を検出し自動的に修正する。NTTは、正規表現によるパターンの確認を実施するプログラムの振る舞いとして、「ECMAScript 2023」に完全準拠した正規表現エンジンの振る舞いを理論モデルとして厳密に定義し、この理論モデルに従って修正結果となる正規表現に誤りがないことを保証する条件を生成する方法を提案した。

 さらに、条件を生成する方法を活用して、修正対象となる正規表現と利用者が希望する規表現に対するポジティブな例(受理される文字列)とネガティブな例(拒否される文字列)を与え、処理時間を短縮するために正規表現を抽象化する機能と、抽象化された正規表現を誤りのない具体的な正規表現にする機能を交互に繰り返して実行することで、誤りがないことが理論的に保証された正規表現を出力するアルゴリズムを考案した。早稲田大学理工学術院の寺内多智弘教授がこの手法の理論的な正確さを検証した。

 NTTによると、パターンに合致する文字列をチェックする正規表現の誤りを自動で修正する技術はあるものの、文字列チェックに比べて膨大なバリエーションを扱う文字列抽出の正規表現の誤りについては極めて高度な専門知識を必要とすることから、機械的に修正する仕組みが難しかった。文字列抽出の正規表現の誤りは、情報漏えいなどのセキュリティ問題やサービス停止など原因になることが多い。

 NTTは、今回の技術を活用することで、高度な専門知識や経験を持たない開発者でもソフトウェアの安全性を向上させることが可能になるほか、非熟練者がAIを用いて作成したプログラムの安全性を確保する効果も期待できるとしている。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
“起こしたい人”と“起こされたい人”をマッチング モーニングコールでつながる音声アプリが3月に登場
ネットトピック
2021-02-09 07:43
「Googleドキュメント」でマークダウンを有効にするには–作業効率の向上に効果
IT関連
2022-09-06 19:05
ツイッターが「ポッドキャスト」タブを開発していることが明らかに
IT関連
2022-03-07 21:26
防水&ペン対応の「Galaxy Z Fold3 5G」発表 3代目になる“フォルダブル”はモバイルの未来か (1/2 ページ)
製品動向
2021-08-13 20:17
AIを使って新たな材料を発見–日本IBMがウェブアプリを公開
IT関連
2021-03-08 16:15
動画配信「日本独自」で勝負 スタジオ確保、地上波連動……競争が激化
IT関連
2021-04-24 05:25
印フィンテックZetaがシリーズDラウンドに向けソフトバンクと交渉中、ユニコーン目前か
フィンテック
2021-04-16 15:38
「脱丸投げ」でERPなどのカスタマイズは2割未満に–ガートナーが提言
IT関連
2024-03-30 08:40
全自動そばゆでロボ、2本腕で本格展開 駅そば店の人材不足に対応
ロボット・AI
2021-03-12 22:17
Linuxへの入門に最適な「Ubuntu Budgie」–シンプルで使いやすいUI
IT関連
2023-05-26 08:00
「GPT-4」を公開したOpenAI、詳細な技術情報は非公開
IT関連
2023-03-21 09:26
Cloudflareが昨日(2022年6月21日)の障害原因はBGPの設定ミスと報告。東京データセンターを含む19の主要データセンターが一時オフラインに
Cloudflare
2022-06-22 12:32
よりパーソナルな感覚のフランス発ひと味違う新デートアプリ「Feels」
ネットサービス
2021-04-19 10:06
サーバレスはAWSの顧客の7割以上、Google Cloudの顧客の6割以上が利用、Datadogの調査結果
AWS
2023-08-29 16:25