ウェブサイト多言語化「WOVN.io」に「高精度住所翻訳」機能–住所をローマ字表記化
今回は「ウェブサイト多言語化「WOVN.io」に「高精度住所翻訳」機能–住所をローマ字表記化」についてご紹介します。
関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。
本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。
Wovn Technologiesは8月17日、ウェブサイト多言語化ソリューション「WOVN.io」の新機能「高精度住所翻訳」を発表した。
高精度住所翻訳は、ウェブサイトに含まれる住所表記を自動かつ高精度でローマ字表記に切り替える。一般的に、住所を翻訳(ローマ字表記化)することは、諸外国ごとに表記の順番が異なる背景もあり、作業の手間や工数を必要とする。機械翻訳に任せたとしても、日本には同音異字の地名が多数存在するため、意図した通りに翻訳されず、誤訳や表記揺れが発生してしまうケースがあるという。
今回の機能開発により、ウェブサイト内の住所表記に対し、形態素解析を用いた独自のアルゴリズムで、Wovn Technologies保有のマスターデータから対象となる住所のローマ字表記を自動で抽出・適用できるようになった。
例えば、「三田」という地名には、「みた」「さんだ」「みつだ」などの読み方がある。高精度住所翻訳では、住所表記が「港区三田」の場合は「Mita」を、「兵庫県三田市」の場合は「Sanda」を適用させる。また「長野県長野市南長野県町」という複雑な住所であっても、区切りとなる箇所を判定し、「Nagano-ken Nagano-shi Minaminagano Agatamachi」と正確にローマ字で表現できる。
また、都道府県名から始まり番地で終わる一般的な住所表記だけでなく、都道府県のみの表記や「〇〇(地名)支店」などの場合もローマ字表記を適用させることができる。なお、同音異字のある地名が単体で記載されている場合には、マスターデータ内で登録数が最も多いローマ字表記が適用されるという。
想定される活用シーンとして、賃貸などの不動産サイト、多店舗展開している小売店サイトや宿泊予約サイト、飲食・観光業界などの情報サイトを同社は挙げ、取り扱い物件や運営施設の住所表記が数多く存在するためと理由を説明する。