GitHub、「GitHub Copilot」にコード参照機能–コード候補がパブリックコードと一致するか検出

今回は「GitHub、「GitHub Copilot」にコード参照機能–コード候補がパブリックコードと一致するか検出」についてご紹介します。

関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 GitHubは米国時間8月3日、「GitHub Copilot」のコード参照機能をプライベートベータ版として提供した。GitHub Copilotが提案するコード候補が「GitHub」にあるパブリックコードと一致することを検出し、そのリポジトリーやライセンスに関する情報に基づいたコード利用の判断を可能にする。

 AIプログラミング支援ツールのGitHub Copilotは、訓練にパブリックコードを使用する。そのため、提案されるコード候補がパブリックコードと一致しているかを知りたいという声が多くの開発者から挙がっていたという。

 コード参照機能は、GitHub上のパブリックコードと一致するコード候補のコンテキストを検出・表示するフィルターを搭載する。フィルターが有効の場合、コード候補の周囲にあるコードの約150文字をチェックし、GitHub.com上の全パブリックコードのインデックスと比較する。レイテンシーバジェットは10〜20msだという。

 一致が検出された場合、一致するコード、そのコードを含むレポジトリーの一覧、適用されるライセンスに関する情報がエディター上に表示される。これらを参照することで、一致するコードを含む候補を破棄することも、利用を許可することもできる。

 コード参照が重要な理由としてGitHubは、GitHub Copilotが提案するコード候補で一致が発生する確率は1%以下だが、この確率は全ユーザーケースで均一ということではないという同社調査の結果を挙げる。周囲にコードを伴う既存アプリケーションというコンテキストでは一致はほとんど発生しないが、何もない、または、ほとんど何もないファイルでは、一致がより頻繁に発生するという。

 提案はプロンプトに大きく依存するため、GitHub Copilotは開発者のタスクに合った候補を提供できる。多くのコードを含む既存のアプリケーションでは、コードに特化した候補が提案されるが、何もない、または、ほとんど何もないファイルでは、コードがわずかなため、パブリックコードと一致する候補がより多く提案されるとGitHubは説明する。

 さらに、候補がパブリックコードと一致する際、多くの場合、十数のリポジトリーと一致ことも明らかになっているという。GitHub Copilotが使用するモデルは、巨大な確率機と同じであり、多くのリポジトリーに出現するコード片は、同モデルで検出される「パターン」である可能性が高いという。

 また、一致するコードを含むリポジトリーの多くは、複数のライセンスで許諾されており、それらが相反するライセンスだという場合もあるという。このことは、一致をそのソースに帰属させることを難しくさせるという。

 参照リストを確認することで、一致を最初から単に破棄するのでなく、帰属させるかどうか、何を帰属させるか、誰に帰属させるかを判断できるとGitHubは述べる。さらに、同様の問題に対する他の開発者によるアプローチを研究することで学ぶことができ、一致する提案を受け入れる前にコードのコンテキストを評価できるとしている。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
ネットワン、ネットワーク特化の独自LLMを開発へ–エンジニア業務の効率化・品質向上を目指す
IT関連
2023-10-27 08:36
クラウドセキュリティを軽視しない–不十分な保護が招く多大なリスク
IT関連
2022-06-22 16:56
エンタープライズ生成AI元年、日本が直面する課題を解決–日本オラクル・三澤氏
IT関連
2024-01-06 12:50
小売DXで拡大するRFIDの役割–ファストリやクローガーも導入のAvery Dennisonに聞く
IT関連
2025-01-06 17:57
マイクロソフト、決算発表で「Teams」の成長を強調–ユーザー数は明かさず
IT関連
2022-07-28 04:15
日立と積水化学、再生材活用の支援システムを開発–2025年度の事業化を目指す
IT関連
2024-06-07 01:21
インテルとロッキード・マーティン、米国防総省の5G対応ソリューションで連携強化
IT関連
2022-04-07 19:38
RPAはエンタープライズITの必須ソリューションになり得るか–UiPath日本法人幹部に聞いてみた
IT関連
2022-05-27 17:18
富士通とHexagon、デジタルツイン技術で提携–「Trusted Society」の実現へ
IT関連
2022-06-26 20:21
日本の社員の40%がハイブリッドワークで生産性と仕事の質の向上を実感—シスコ調査
IT関連
2022-06-03 06:27
Google Cloud FunctionsがPHPをサポート開始 サーバレスの関数が記述可能に
クラウドユーザー
2021-04-29 14:28
NTT Com、「IOWN APN」経由の分散DCで生成AI学習に成功–単一DCと遜色ない結果に
IT関連
2024-10-10 05:28
「日本社会のDX」に挑む牧島デジタル大臣の意気込み
IT関連
2022-04-29 23:11
バイデン米大統領、プーチン露大統領に「サイバー攻撃にはサイバーで反撃する」と警告
企業・業界動向
2021-06-18 20:41