「WOVN.io」にワイルドカード翻訳機能–数字を含む文字列の翻訳を円滑に

今回は「「WOVN.io」にワイルドカード翻訳機能–数字を含む文字列の翻訳を円滑に」についてご紹介します。

関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 Wovn Technologies(WOVN)は2月28日、ウェブサイト多言語化ソリューション「WOVN.io」の新機能「ワイルドカード翻訳」を発表した。数字を含む文字列の翻訳の自動運用をより円滑にする。

 ウェブサイトにおいてはHTMLタグで囲まれた文字が、ひとかたまりの文字列として認識される。そのひとかたまりの文字列に対し、品番や長さ・重さなどを示す数字だけが異なるパターンが存在するような場合、機械翻訳エンジンはそれぞれ異なる文字列と認識する。

 例えば、ECサイトを機械翻訳する場合、同じ商品でありながらも「電源コード5m」「電源コード10m」「電源コード15m」といった数字のみが異なる商品ページは、それぞれ異なる文字列として認識される。そのため、「five m」「ten m」「15m」といった不統一な翻訳結果が表示されてしまうことがある。

 このような課題に対応するには、HTMLのソースコードを修正し、個々の数字を翻訳対象から除外する、もしくは、数字を含む文字列を人力で翻訳する必要があった。

 ワイルドカード翻訳は、数字部分のみを可変(ワイルドカード)として捉えることで、不要な機械翻訳作業を防ぐ。数字を含む文字列のパターンをWOVN.ioに一度登録すれば、再度同様の文字列パターンの自動翻訳時にも、数字部分を原文に合わせつつ、統一された翻訳対応が可能になる。

 そのため、色違いを示す商品番号が商品名に入っている場合でも、パターン登録によって商品番号が変数として認識されるようになり、文字列自体は同一パターンとして翻訳される。

 ニュースサイトやコーポレートサイトでも、曜日や日付を伴う記事コンテンツを翻訳する場合、曜日をパターン登録することで日付を可変と認識できるようになる。「2023/02/28(火)」の翻訳として「2023/Feb/28 (fire)」「2023/02/twenty eight (Tue)」といった揺れが発生するのを防ぎ、統一的な翻訳運用が可能になる。

 WOVNは今後も機能の改良を続けると話す。例えば、WOVN.ioがウェブサイトの情報を収集することで、ワイルドカード翻訳の対象となり得るパターンを持つ箇所をあらかじめ検出し登録を推奨するなどして、さらなるユーザーの利便性向上を図りたいとする。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
富士通ら、漢検協会のデジタル学習コンテンツを提供–「GIGAスクール構想」に対応
IT関連
2021-04-15 23:24
五輪やJALの公式サイト、PSNなどで一時アクセス障害 AkamaiのDNSが原因か
IT関連
2021-07-24 11:00
「人」をセキュリティ対策の一角に–ノウビーフォー、日本で事業を拡大
IT関連
2023-09-21 14:59
日立造船、IoT基盤と連動するデータ分析/機械学習システムの運用を効率化
IT関連
2021-04-30 06:56
個人投資家はどうすれば?–市場が恐れる中国景気減速とタリバンリスク
IT関連
2021-08-20 18:00
Epic Games、超リアルなデジタルヒューマン作成ツール「MetaHuman Creator」をクラウドで提供へ Webブラウザだけで制作可能に
イラスト・デザイン
2021-02-12 01:18
ゴルフスイングの軌道をVRで修正してくれる「Actuated Club」 東工大が開発 :Innovative Tech
トップニュース
2021-07-19 12:19
スカイマティクスが定量・定性データの地図表現を自動生成できるクラウド型サービス「SEKAIZ」提供開始
ネットサービス
2021-05-11 23:10
WebAssemblyで、JITコンパイラに迫る高速なJavaScriptエンジンを実装へ。Bytecode Allianceが技術解説。JavaScript以外の言語でも
JavaScript
2021-06-07 23:41
Googleのプライバシー保護、日本企業から歓迎と懸念の声
IT関連
2021-03-06 10:47
機械学習を自動化する「AutoML」でデータサイエンティストは不要に?
IT関連
2022-07-22 01:20
ジンズ、ウェブサイトの技術的課題を解析してコンバージョン率を改善
IT関連
2021-04-15 14:16
AWS、商用サービス化を制限するライセンス変更に対抗し「Elasticsearch」をフォーク 独自のオープンソース版へ (1/2 ページ)
クラウドユーザー
2021-01-27 01:42
ウルシステムズ、長谷工グループの新しいコミュニケーションサービス構築を支援
IT関連
2022-09-02 00:04