データプラットフォームはAIプラットフォーム–Cloudera幹部が見据える「ChatGPT」の先

今回は「データプラットフォームはAIプラットフォーム–Cloudera幹部が見据える「ChatGPT」の先」についてご紹介します。

関連ワード (ビッグデータ等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 Clouderaは8月2日、プライベートイベント「Evolve 2023 Tokyo」を開催。同イベントに登壇するため来日したプロダクトマネジメント担当副社長のPriyank Patel氏に人工知能/機械学習(AI/ML)の最新動向について聞いた。

 「ChatGPT」をはじめとする生成AIの利便性や可能性への注目が急速に高まっている。Patel氏は、ChatGPTの先を見据えた企業のAI戦略として、「信頼のできるAIを大規模に展開するには、まずデータに目を向けることが重要」だと語る。特に、企業が保有する「自社のコンテキスト(文脈)に照らし合わせたデータ」に着目すべきだといい、企業が持つ独自のデータが「AI戦略に『違い』をもたらす」と強調した。

 同氏はエンタープライズにおけるAI活用のこれまでを振り返った。従来のMLモデルでは、主にデータサイエンティストが中心となって特定のデータセットに対して学習を繰り返しながら専用モデルを構築していく過程を踏んでいた。それが大規模言語モデル(LLM)では、汎用モデルを利用するため追加のデータや学習なしに多くの開発者が活用できるという。

 LLMの企業利用に必要なことととして、Patel氏は「文脈の認識」「強力なプライバシー」「ホワイトボックス」の3つを挙げる。特に文脈の認識については、「企業が有するナレッジベースの活用が重要」(同氏)だと話す。Couderaでは、機械学習プラットフォーム「Cloudera Machine Learning」上の「Applied Machine Learning Prototypes」(AMP)で、企業が保有する独自のデータで拡張されたLLMチャットボットをユースケースとして提供している。

 Patel氏は、オープンソースとして提供されているLLMにも目を向ける。「Stanford Alpaca」や「StarCoder」「BLOOM」「Llama 2」「Falcon 40B」など、オープンコミュニティーで開発されたLLMが数多くリリースされており、OpenAIのChatGPTやGoogleの「Bard」といったクローズなLLMと比べても急速な進化を遂げている。「AIにおけるオープンソースの力が大きくなっている」と同氏は指摘した。

 また、エンタープライズ向けのAIスタックが拡大する中、そのエコシステムをフルに活用するには、データプラットフォームのオープン性と相互運用性が重要になるとの見解を示した。

 シンガポールに拠点を置く大手銀行のOversea-Chinese Banking Corporation(OCBC)は、LLMを用いてソースコードを自動補完するツール「OCBC Wingman」を開発。StarCoderを活用しており、約2000人の開発者が使用しているという。オンプレミスで運用するため、外部環境にコードが流出する恐れがなく、学習データとして収集されることもないとのこと。OCBCが標準として定めるコード基準やコード例、ライブラリーなど、同社の文脈を理解したコーディング支援を可能にしている。

 もう一つは、コールセンター向けの自動音声認識でのLLM活用になる。これは、顧客とオペレーターの会話を音声からテキストに変換する機能で、テキスト化された会話をAIが自動で要約することもできる。「コンタクトセンターのプロセスを簡素化し、顧客による苦情を特定することに役立っている」(Patel氏)

 OCBCの事例のように生成AIを本番環境に組み込み、幅広い影響力を示している中、企業が確かなAI戦略の構築していくためには「変化していないことに焦点を当てること」が重要だとPatel氏は話す。具体的には、「セキュリティ、ガバナンス、暗号化」「エンタープライズ対応」「オープンコミュニティー」「コスト管理」「データプラットフォーム」を挙げ、「データプラットフォームは企業のAIプラットフォームであり、LLMなどのさまざまなテクノロジーの進化などがあったとしても変わらない」と強調した。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
シン・エヴァ興収99.9億円で「裏コード999」トレンド入り 「また無茶させるわ」
くらテク
2021-07-13 19:47
「Windows 11 24H2」、最新パッチで複数の問題を修正
IT関連
2024-11-15 04:26
ゴールは信頼の醸成–セールスフォースの「最高信頼責任者」の活動とは
IT関連
2023-03-07 06:31
Twitter、「誤解を招く投稿」を報告するテストを米、韓国、豪で開始
アプリ・Web
2021-08-19 18:23
日本のセキュリティ人材、前年比24%増もまだ11万人が不足–ISC2調査
IT関連
2023-11-03 15:51
【インタビュー】「ブロックチェーンとそのテックは政治から切り離すべき」元米通貨監督庁長官が語る可能性
ブロックチェーン
2021-04-19 07:01
GitHub、Copilotでより高い精度のコードを生成させる方法を指南。関連ファイルを開く、トップレベルのコメントを書くなど
GitHub
2024-03-28 14:03
「GitHub Discussions」がプライベートリポジトリでも利用可能に。電子掲示板を用いたコミュニティ機能を追加
GitHub
2021-03-11 15:31
ピュア・ストレージ、フラッシュベースのネイティブな統合型ブロック/ファイルストレージを提供
IT関連
2023-04-29 23:31
くら寿司、全519店舗で「LINE WORKS」活用–業務時間が短縮
IT関連
2022-12-22 09:49
グーグルが最初のAndroid 12開発者プレビューを公開
ソフトウェア
2021-02-20 09:55
新潟県の粟島浦村、電子契約「クラウドサイン」導入–村・離島における日本初の事例
IT関連
2022-05-24 09:44
バレエ公演の無料ライブ配信を12万人が視聴 「手応え感じた」と新国立劇場
くらテク
2021-05-07 15:31
テラスカイ、「Salesforce」のデータを自然言語で呼び出せる生成AIサービス「mitoco AI」を提供
IT関連
2024-04-11 02:24