中国政府の要求を満たす最強の「検閲クラウド」の実力とは
今回は「中国政府の要求を満たす最強の「検閲クラウド」の実力とは」についてご紹介します。
関連ワード (中国ビジネス四方山話、開発等) についても参考にしながら、ぜひ本記事について議論していってくださいね。
本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。
中国では、「抖音」(ドゥイン、「TikTok」の中国国内版)を中心にライブ配信やショート動画、音声配信などのマルチメディアコンテンツが普及している。その一方で、性的・暴力的なコンテンツや政府への批判、話題を拡散させまいと、世界でも有数の規模で検閲を実施している。以前のようにテキストが主体のころであれば、禁止用語が含まれるコンテンツを非表示にするため、自動あるいは手動で精査していたが、今では画像や動画まで確認できるようになっている。
中国政府は2022年9月末、ライブ配信サービスを提供する企業は、動画の検閲を可能にするシステムを導入するとともに、リアルタイムに監視する特別な体制を構築し、コンテンツの問題をできるだけ早く発見して対処する必要があると発表した。担当省庁の文化部などが発表した「文化和旅遊部関于規範網絡演出劇(節)目経営活動 推動行業健康有序発展的通知(征求意見稿)」という通知の一節である。これにより、音声や映像、生放送の内容だけでなく、動画に寄せられた解説や意見も含めて検閲しなくてはならなくなったのである。
網晴科技では、そうしたニーズに応えたクラウドAI製品「網晴内容安全大脳」を提供している。同社ウェブサイトによると、主要なネットサービスに導入されているという。その実力について、製品ページの情報から読み解いていく。
同社はコンテンツの検閲について長年にわたる技術の蓄積と豊富な経験があり、それに基づいて網晴内容安全大脳を独自に開発。これはAIを活用したクラウド型のオンライン検閲システムで、検閲チームと連携する仕組みとなっている。
同社では「何億もの」禁止用語リストを保有しているとし、ポリシーモデルやセマンティック推論を活用して検閲するとしている。対象となるのは政治的、暴力的、性的な表現のほか、悪い価値観や広告の有無、その他の禁止事項なども含まれるという。加えて、文法の間違いや誤字などの文章校正機能も備わっている。
画像認識については、光学文字認識(OCR)で文字を抽出して内容に問題はないか、顔認識で特定の政治家に関するものではないか、二次元バーコードのリンク先に問題はないかなどを確認する。テキストと同様、政治的に問題がある内容をはじめ、暴力的、性的な表現、悪い価値観や広告の有無、その他の禁止事項を特定できるようになっている。深層学習や強化学習、枝刈り処理などにより認識技術を強化しているという。
動画に対してもあらゆるコンテンツの検閲が可能だと説明されている。リアルタイムにフレームごとの調査を行い、問題となる表現を発見する。また、動画を音声、声紋、感情などの項目に分類し、政治的、暴力的、性的な禁止事項を分析する。動画中に流れるコメントについてもリアルタイムに検閲できる。映像や音声のトラブルも検知するという。
近年急速に普及しているライブ配信についても同様で、問題のある配信動画を検出してワンクリックで即座にブロックでき、「悪影響を最小限に抑える」としている。
アカウントの審査機能も備えている。登録ユーザーのアバター(ネットで自分の分身となるキャラクター)やニックネーム、自己紹介、実名認証などを包括的に審査し、信頼できるものであるかどうかを判別する。
このように、網晴科技のオンライン検閲システムはAIを活用し、政府が問題視する表現を含んだ画像や動画を検閲官に提案する。画像や動画はテキストと比べて情報量が多く、検知された膨大なコンテンツの最終判断は検閲官に求められるため、その業務量はとても多そうだ。