OpenAI、AIトレーニング用データセットを構築するパートナーシップを発表
今回は「OpenAI、AIトレーニング用データセットを構築するパートナーシップを発表」についてご紹介します。
関連ワード (CIO/経営等) についても参考にしながら、ぜひ本記事について議論していってくださいね。
本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。
OpenAIは米国時間11月9日、人工知能(AI)モデルのトレーニングに用いるデータセット構築に向けて、広範な協力を求める「OpenAI Data Partnerships」を発表した。さまざまな組織の協力を得て、オープンソースおよびプライベートのデータセットを構築する計画だ。
同社によると、人類にとって安全で有益な汎用人工知能(AGI)を実現するには、AIモデルがあらゆるテーマ、業界、文化、言語について、理解を深める必要があり、可能な限り広範なデータセットが必要だという。
そのため、AIモデルがさまざまな領域に対する理解を深められるように、各国と業界にコンテンツの提供を呼びかけている。同社は既に、「GPT-4」のアイスランド語能力を強化するためにアイスランドの政府や企業と提携したり、非営利組織の協力を得て、膨大な法律文書をAIトレーニングに組み込んだりしているという。
OpenAIは、「人間社会を反映する大規模なデータセット」で、現在オンラインで容易にアクセスできないものを求めている。テキスト、画像、音声、動画などの形態を問わず、長い会話や文章などのデータを求めている。
同社は独自の次世代AI技術によって、データのデジタル化と構造化を支援できるという。これには光学式文字認識(OCR)技術や、自動音声認識(ASR)などが含まれる。機密情報や個人情報、サードパーティーに属する情報を含むデータセットは求めていないが、これらの情報を取り除くことには協力できるという。