NTTと早大、誤った正規表現の文字列抽出を自動で修正する技術を発表

今回は「NTTと早大、誤った正規表現の文字列抽出を自動で修正する技術を発表」についてご紹介します。

関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 NTTと早稲田大学は6月16日、誤った正規表現の文字列抽出を検出して自動的に修正する技術を世界で初めて実現したと発表した。同17~22日に開催される「PLDI2023」で詳細を報告するという。

 今回開発した技術は、多様なバリエーションを扱うことからあいまいさのない正確な記述が求められる正規表現の文字列抽出において、誤った記述を検出し自動的に修正する。NTTは、正規表現によるパターンの確認を実施するプログラムの振る舞いとして、「ECMAScript 2023」に完全準拠した正規表現エンジンの振る舞いを理論モデルとして厳密に定義し、この理論モデルに従って修正結果となる正規表現に誤りがないことを保証する条件を生成する方法を提案した。

 さらに、条件を生成する方法を活用して、修正対象となる正規表現と利用者が希望する規表現に対するポジティブな例(受理される文字列)とネガティブな例(拒否される文字列)を与え、処理時間を短縮するために正規表現を抽象化する機能と、抽象化された正規表現を誤りのない具体的な正規表現にする機能を交互に繰り返して実行することで、誤りがないことが理論的に保証された正規表現を出力するアルゴリズムを考案した。早稲田大学理工学術院の寺内多智弘教授がこの手法の理論的な正確さを検証した。

 NTTによると、パターンに合致する文字列をチェックする正規表現の誤りを自動で修正する技術はあるものの、文字列チェックに比べて膨大なバリエーションを扱う文字列抽出の正規表現の誤りについては極めて高度な専門知識を必要とすることから、機械的に修正する仕組みが難しかった。文字列抽出の正規表現の誤りは、情報漏えいなどのセキュリティ問題やサービス停止など原因になることが多い。

 NTTは、今回の技術を活用することで、高度な専門知識や経験を持たない開発者でもソフトウェアの安全性を向上させることが可能になるほか、非熟練者がAIを用いて作成したプログラムの安全性を確保する効果も期待できるとしている。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
プロeスポーツチーム「REJECT」運営元が3.6億円のシリーズA調達、トレーニング環境投資や新規事業開発加速
ゲーム / eSports
2021-04-27 12:09
ベネッセ、販売管理や新顧客基盤を含む基幹システムをオラクルのクラウドで構築
IT関連
2022-12-15 02:50
パナソニック コネクトが戦略的投資を続行するBlue Yonder
IT関連
2023-11-02 05:55
JAMスタックのNetlify、Denoを採用したサーバレス環境「Netlify Edge Functions」ベータ公開。Deno Deployの分散エッジでNext.js/Nuxt/SvelteKit/Remixなど実行
Deno
2022-04-21 03:09
JAMスタックを実現する国産サービス「kuroco」正式リリース。GitHub Actionsでビルドし、Webホスティング、APIサーバなど提供。月額1100円分まで無料
API
2021-04-20 07:41
Apple Watchで心疾患発見を目指す、慶應医学部 木村雄弘先生に訊く(WWDC 2021)
ヘルステック
2021-06-05 07:04
セールスフォースの「Data Cloud」、データ活用のための「ラストワンマイル」を支援
IT関連
2024-09-07 06:09
マイクロソフト、経理部門を自動化する「Copilot for Finance」発表。決算書や未収金などの確認、予実分析などをAIが実行
ERP
2024-03-06 07:35
Splunkがクラウドサービス「Splunk Observability Cloud」正式リリース。インフラのからアプリの性能まですべてを統合監視
Splunk
2021-05-12 06:56
緊急通報対応を効率アップさせるクラウドベース開発のRapidDeployが約32億円調達
パブリック / ダイバーシティ
2021-05-03 18:18
Tinderがマッチングを促進する新機能「Vibes」を発表、48時間限定のイベント
ネットサービス
2021-05-08 12:34
マイクロソフトが初心者向け生成AI学習教材公開/ソフトウェアに関わる人が知っておきたい法則10個/GitHubはMac miniを分解している、ほか。2024年1月の人気記事
編集後記
2024-02-02 23:36
「ロマ佐賀2021」は「サガ風呂」 「ねんがんのブラックモンブラン」も
くらテク
2021-07-17 00:47
東京都日野市、LGWAN 接続系からのローカルブレイクアウトを構築
IT関連
2024-10-10 09:01