「バイアスのないAI」実現への道のりはデータから始まる
今回は「「バイアスのないAI」実現への道のりはデータから始まる」についてご紹介します。
関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。
本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。
バイアス(偏見)を持たず、結論に至った過程を説明できる人工知能(AI)を実現しようとする取り組みは称賛に値するものの、乗り越えなければならない障壁が数多くある。というのもAIの公正さは、取り込まれるデータに大きく依存するためだ。
AIのバイアスや不公正さの排除に手こずる中、企業やテクノロジー分野のリーダーらは、AIに対するより「責任ある」アプローチに注力する必要があるという点でようやく意見の一致を見ようとしている。Appenが最近公開したレポート「State of AI and Machine Learning Report 2022」(2022年版AIと機械学習(ML)の状況レポート)では、顧客や市場、機会にまつわる意志決定における役割がますます大きくなってきているデータに対する懸念が高まっているという知見が示されている。また、自社の有するデータが人々やコミュニティー、企業に問題をもたらしがちだという認識をこれらリーダーが有していることも示唆されている。なおこのレポートは、The Harris Pollの協力を得て504人のIT幹部を対象に実施した調査に基づいている。
しかし、McKinseyの2021年の調査では、AIに最も前向きに取り組んでいる企業であっても、その大多数はAIによるバイアスを排除するための方策をまだ講じてないことが明らかにされている。
その一例を挙げると、表面化していない隠れた特性や特質を見つけ出すために、訓練データやテストデータを精査していると答えた回答者は半数に満たない(47%)。
また、インジェスチョンの最中に、歪曲(わいきょく)した、あるいは偏見のあるデータの有無を自社のデータプロフェッショナルが積極的にチェックしていると答えた回答者も同じ割合だった。一方、データプロフェッショナルがそうしたデータをモデル開発の複数の段階で積極的にチェックしていると答えた回答者は36%にとどまった。
Appenの調査では、高品質のデータの調達がAIを実現する上での障壁になっていることが示されている。過半数(51%)の回答者が、データの精度は自社のAIユースケースにとって重要だと答えているが、高いデータ精度(90%超)を達成しているとした回答者は6%にすぎなかった。同社の最高経営責任者(CEO)Mark Brayan氏は「多くの人々が、貧弱なデータセットを用いて優れたAIを実現しようとして難題に直面している」と述べている。また同社のウェブページには、「きちんとしたAIモデルを構築するには正確で高品質なデータが必要となる。残念ながら、ビジネスリーダーやテクノロジストらはデータの正確さという問題に取り組む中、理想と現実との間にある大きなギャップに直面していると述べている」と記されている。