AIスタートアップSnorkelが目指す、エキスパート主導のAI開発

今回は「AIスタートアップSnorkelが目指す、エキスパート主導のAI開発」についてご紹介します。

関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 人工知能(AI)の分野が大きな盛り上がりを見せた1つ前の時代である70年代後半から80年代にかけての時期に、人間の知識をコンピューターに入力したプログラムである「エキスパートシステム」と呼ばれるアプローチが知られるようになった。

 エキスパートシステムは最終的には失敗に終わったのだが、これは、2つの理由からコードとして実現するのが困難であることが明らかになったからだ。そもそも、専門家が自分の知識を本当の意味で明確に記述すること自体が難しかったし、構築と維持に手間がかかりすぎた。つまり、構造的に規模を拡大することが難しかったわけだ。

 サンフランシスコに本社を置く創業3年目のAIスタートアップであるSnorkelは、米国時間12月14日、この古いアプローチに興味深いひねりを加えた製品を発表した。同社の表現によれば、この製品は、ニューラルネットワークを開発するにあたって再び人間の専門家に主導権を握らせることになるツール群だという。

 Snorkelの「Data-centric Foundation Model Development」(データ中心型基盤モデル開発)と呼ばれる製品は、同社の主力製品である「Snorkel Flow」をさらに強化するもので、この新機能を使えば、いわゆる「基盤モデル」を使って、ラベル付きのトレーニング用データを自動的に作成する関数を作ることができる。基盤モデルとは、OpenAIの「GPT-3」などを始めとする、これまでに存在する中でも最大規模のニューラルネットワークのことだ。

 Snorkel Flowに導入されるこの新たな関数を使えば、特定分野の専門家ではあるが、プログラマーではない人々が、基盤モデルをトレーニングして特定の作業を実行できるモデルを作成する際に使用するラベル付きデータセットを、自動的に生成できるようになる。

 Snorkelの共同創業者で最高経営責任者(CEO)のAlex Ratner氏は、米ZDNetの「Zoom」によるインタビューの中で、「私たちは、特定領域の専門知識はあるが開発者でない人材をスキルアップし、エンパワーすることで、そのプロセスでもっと力を発揮できるようにしたいと考えている」と語った。

 「これらの専門知識を持った人々は、しばしば手動でデータにラベル付けを行うための閉じた環境に押し込められている」とRatner氏は言う。「私たちは、そうした人材に主導権を握ってもらい、データサイエンティストと一緒にプロジェクトを主導したり、自ら主導したりしてもらいたいと思っており、彼らはそういう立場に立つべきだと考えている」

 OpenAIのGPT-3や「Dall•E 2」、Googleの「RoBERTa」などの基盤モデルが人気を集めているのは、それらのモデルが持っているテキストや画像を生成する能力が、カスタマーサービスを提供するボットや、業務文書の作成や、在庫の写真の作成など、企業の幅広い業務に応用できるからだ。

 基盤モデルは膨大なデータを必要とする。Open-AIが2020年にトレーニングしたGPT-3には、有名なデータセット「CommonCrawl」が使われているが、これは、2016年から2019年にかけてウェブページから取得された、45TB相当の圧縮テキストデータだ。OpenAIは、そのデータを扱える規模にするために、キュレーションを行ってサイズを570GBまで絞らなければならなかった。ほとんどの企業には、負担が大きすぎてこのようなモデルをトレーニングすることはできない。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
サイバーセキュリティ担当者の多くは燃え尽き症候群に陥っている
IT関連
2022-08-10 10:53
第20回:2030年以降も生き残るIT部門・リーダーの姿とは? 先進テクノロジーとの正しい付き合い方–その1
IT関連
2022-10-15 01:06
世界中のITエンジニアが悩まされている原因不明でテストが失敗する「フレイキーテスト」問題。対策の最新動向をJenkins作者の川口氏が解説(後編)。DevOps Days Tokyo 2022
CI/CD
2022-06-06 12:01
独立系SIerのSRA、クラウドERPで経営基盤を刷新–提案型ビジネスへの変革を推進
IT関連
2022-06-02 05:58
AMD、デスクトップPC向けCPU「Ryzen 7000」シリーズを発表–最大29%高速化
IT関連
2022-09-01 02:42
2日間で1億円──投げ銭“スパチャ”の流行は日本特有? YouTube幹部に直撃インタビュー
イラスト・デザイン
2021-03-19 16:06
日本企業の約8割が内部脅威に対策せず–Imperva調査
IT関連
2022-04-28 20:30
インテル、裏面電源供給技術「PowerVia」のテスト結果を公開
IT関連
2023-06-08 12:10
QUICK、生成AI利用の新サービスを開発–石川県が情報発信に活用
IT関連
2023-08-26 06:17
NECら、新型コロナウイルスと結合する人工DNAアプタマーの開発に成功
IT関連
2021-05-10 10:40
汎用原子レベルシミュレータ「Matlantis」がクラウドサービスで登場。原子スケールで材料の挙動を再現、深層学習モデルで計算を数万倍に高速化。Preferred Networksの関連会社「PFCC」から
クラウド
2021-07-07 04:33
米スーパーKrogerが初の大規模ロボット化フルフィルメントセンターをオハイオに開設
ロボティクス
2021-04-17 21:00
全米商工会議所、AIの規制を提言–飛躍的成長を適切に規制するための5つの柱
IT関連
2023-03-14 03:11
AIが英語の発音を指導–日本MS、「Next GIGA」に向け“三方よし”探る
IT関連
2023-10-19 19:14