セレブラスのCEOに聞く、オープンソースでのGPTモデル公開の意義
今回は「セレブラスのCEOに聞く、オープンソースでのGPTモデル公開の意義」についてご紹介します。
関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。
本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。
人工知能(AI)分野、特に「生成型AI」として知られ、文章や画像の自動生成を可能にすることで現在高い人気を集めている分野は、発展に向けた扉が閉ざされかねないリスクにさらされている。というのも、研究成果についての詳細を公開しないという各社の姿勢によって進歩のペースが鈍化すると懸念されているためだ。
しかし、こうした秘密主義を目の当たりにしたあるAI企業が、情報公開の先陣を切るべく自ら行動を起こした。
AI分野のパイオニアであり、AI向けの専用コンピューターを製造し、世界最大のコンピューターチップを開発したCerebras Systemsは米国時間3月28日、複数の生成型AIプログラムをオープンソースとして公開した。これらプログラムの利用に制限は課されていない。
このプログラム群はCerebrasによって「訓練」されている。つまり同社のパワフルなスーパーコンピュータによってパフォーマンスの最適化が施されているため、リサーチャーらが抱えている本来の目的とは直接関係しない部分の作業を低減できる。
Cerebrasの共同創業者であり、最高経営責任者(CEO)でもあるAndrew Feldman氏は米ZDNetとのインタビューで、「企業は1~2年前とは異なった意思決定を下すようになっているが、われわれはそうした意思決定について同意していない」と述べ、ChatGPTの開発元であるOpenAIが、3月にリリースした新たな生成型AIプログラムである「GPT-4」に関する技術的詳細の公開を控えたことで、AI研究分野の各所から批判の声が上がった一件をほのめかした。
Feldman氏は「オープンで活気に満ちたコミュニティーであるべきだとわれわれは確信している。単にリサーチャーたちのみでなく、また3人や、4人、5人、8人の大規模言語モデル(LLM)の専門家らのみのコミュニティーでもなく、新興企業や中規模企業、大企業がLLMを訓練できるような、活気に満ちたコミュニティーがわれわれや、その他の人々にとって価値あるものだと確信している」と述べた。
LLMとは、機械学習(ML)に基づくAIプログラムであり、神経回路網を模したネットワークによって、学習用のサンプルデータから単語の統計的な分布を導き出すようになっている。このプロセスを経ることでLLMは、単語の並びに登場する次の単語を予測できるようになる。ChatGPTなどの人気の生成型AIプログラムを支えているのはこうした能力だ。
MLのアプローチを採用した他の事例として、OpenAIの「DALL·E」といったものもある。DALL·Eは、提示されたテキスト表現に基づいて画像を描いてくれる生成型AIだ。
Cerebrasは今回、2018年に巻き起こった生成型AIブームの発端となったOpenAIの「GPT」プログラムと同じ形式のLLMを7つ公開した。そのコードは、AI分野の新興企業であるHugging Faceのウェブサイトと、GitHubから入手可能だ。