GitHub、ファインチューニングモデルを「Copilot Enterprise」で提供–コード提案をカスタマイズ可能に

今回は「GitHub、ファインチューニングモデルを「Copilot Enterprise」で提供–コード提案をカスタマイズ可能に」についてご紹介します。

関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 GitHubは米国時間9月10日、ファインチューニングモデルを「GitHub Copilot Enterprise」ユーザー向けに限定パブリックベータ版を提供した。同モデルを使用することで、AIプログラミングツール「GitHub Copilot」をユーザー独自のコードベースやコーディング慣習でカスタマイズし、特定のニーズに合わせて関連性、品質、一貫性のあるコード補完支援の向上を提供可能にする。

 内部API、特殊なフレームワーク、独自の言語、厳格なコーディングスタイルを使用している組織は、ファインチューニングモデルの恩恵を受けることができるとGitHubは語る。例えば、「COBOL」のようなレガシー言語を使用している金融機関は、ファインチューニングモデルを使って特有のコーディング要件に対応できる。テクノロジーまたはヘルスケア分野では、クラウドリソースが組織の方針に従ってデプロイされているかといったコンプライアンスとセキュリティ基準を順守するため、社内ライブラリーに依存することが多くあるが、コーディングの正確性・効率性を大幅に改善できるという。

 また、開発者は、調整の必要が少ないコードを受け取ることができるため、新しいチームメンバーのオンボーディングを迅速化でき、ベテラン開発者も修正ではなく開発により集中できるようになる。より関連性が高く、高品質で一貫性のあるコーディング支援を提供することは、GitHub Copilotを組織にとってさらに役立つツールとするための大きな前進とGitHubはアピールする。

 同社では、GitHub Copilotをカスタマイズするための取り組みを続けており、GitHub Copilot Enterpriseでは、リポジトリーインデックスとナレッジベースがまず導入されている。ともに検索拡張生成(RAG)を活用するが、RAGは、チャット体験を最新の出力で改善するのには有効な一方で、リアルタイムでのコード補完で求められるパフォーマンスを満たさないという。今回、ファインチューニングでコード補完体験にカスタマイゼーションが導入されたことで、GitHub Copilotがコンテキストに応じた提案をインラインコーディングで必要な速度で提供できるようになったとGitHubは強調する。

 各モデルのカスタマイズには、低ランク近似(Low-Rank Approximation:LoRA)手法が使われる。最も重要なモデルのパラメーターの小さなサブセットを教師あり学習フェーズでファインチューニングすることで、モデルの管理性と効率性を高める。これは、従来のファインチューニング技術に比べてより高速かつ安価な学習方法でもあるという。さらに、ファインチューニングのプロセスは、GitHub Copilotからの提案がどのように対処されているかに関するインサイトも取り入れているため、組織が持つ特定のニーズにモデルがより密接に適合していることを確かにする。

 チューニングプロセスには「Azure OpenAI Service」が利用され、学習パイプライン全体でスケーラビリティーとセキュリティを提供する。

 プライバシーとセキュリティについて、ユーザーのデータはユーザーのものであり、ほかの顧客のモデルを学習させるために使われることはないと同社は述べる。ユーザーのカスタムモデルは非公開のままで、完全に制御できるという。

 学習プロセスを開始すると、レポジトリーデータとテレメトリーデータはトークン化され、一時的にAzureの学習パイプラインにコピーされる。このデータの一部は学習に使われるが、残りは検証と品質評価用に確保される。ファインチューニングプロセスが完了すると、モデルには一連の品質評価が実施され、基本モデルを上回っているかが確認される。これには検証用データに対するテストが含まれ、新しいモデルが、ユーザーのレポジトリー固有なコード提案を改善しているかが確認される。

 モデルは、品質チェックに合格すると、Azure OpenAI Serviceに展開される。このステップは、複数のLoRAモデルを大規模にホストすることを可能にする一方で、それらをネットワークで分離することを可能にする。プロセスの完了後、一時的な学習データは全て削除され、データフローは通常の推論チャネル経由で再開される。GitHub Copilotのプロキシーサービスにより、適切なカスタムモデルがコード補完で使われるようになる。

 ファインチューニングモデルは現在、限定パブリックベータ版として公開されており、ウィッシュリストから利用を申し込める。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
「GVA manage」、法律相談QAデータベース作成の自動化とAIチャットボット機能を提供–「ChatGPT API」活用
IT関連
2024-01-23 07:40
AIに対する間違った思い込みはどこから生まれるのか
IT関連
2023-03-29 03:03
女性起業家の輩出目指す、世界最大の女子中高生向けアプリコンテストTechnovation Girlsが日本公式ピッチイベント
パブリック / ダイバーシティ
2021-03-27 20:36
SQLite、複数クライアントからの同時書き込みを可能にする「BEGIN CONCURRENT」文を実装へ
RDB
2023-08-01 21:58
ClubhouseのAndroidアプリ(β)、日本は5月18日リリース
アプリ・Web
2021-05-18 02:33
ドリーム・アーツ、米企業とクラウドセキュリティを開始–JCBが最初の顧客に
IT関連
2023-12-22 02:38
BaaSプラットフォームを手がけるKippが累計5億円調達、金融機関にサービス提供開始
フィンテック
2021-04-14 15:34
「コロナ拡大以降、バックオフィスのDXが進んでいない」は76%–LegalForce調査
IT関連
2022-04-07 14:32
デジタルサイネージ広告の勝機–失敗から学ぶ、メディア開発に必要な4視点
IT関連
2024-04-05 14:17
日立、再生可能エネルギーの使用状況を可視化するシステム開発
IT関連
2021-01-27 16:07
Docker Desktop内のコンテナに対して「localhost」でアクセス可能に、WSL2のストレージ領域を自動で縮小など新機能、Docker Desktop 4.34正式リリース
Docker
2024-09-05 18:38
SnowflakeとNVIDIAが協業–企業の生成AI活用をデータクラウドで支援
IT関連
2023-06-28 17:27
Ultra EthernetコンソーシアムをAMD、インテル、シスコ、マイクロソフトなど9社が設立。AIやHPCに最適化したイーサネット仕様を策定へ
AMD
2023-07-26 14:49
極右に人気でAWSに締め出された「Parler」の創業者CEO、取締役会が解雇
企業・業界動向
2021-02-05 23:04