自律型AIソフトウェアエンジニア「Devin」登場。Readmeを読んで環境構築、Print文を使ってデバッグなど

今回は「自律型AIソフトウェアエンジニア「Devin」登場。Readmeを読んで環境構築、Print文を使ってデバッグなど」についてご紹介します。

関連ワード (構築、課題、開発等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、Publickey様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


AIスタートアップのCognitionは、自律型のAIソフトウェアエンジニア「Devin」を発表しました。

Devinは人間が課題を与えると、自律的に情報を参照し、コーディングやデバッグ、デプロイを行い、システム構築を実現するAIソフトウェアエンジニアだと説明されています。

Today we're excited to introduce Devin, the first AI software engineer.

Devin is the new state-of-the-art on the SWE-Bench coding benchmark, has successfully passed practical engineering interviews from leading AI companies, and has even completed real jobs on Upwork.

Devin is… pic.twitter.com/ladBicxEat

— Cognition (@cognition_labs) March 12, 2024

下記はCognition AI CEOのScott Wu氏。

Devin開発元Cognition CEOのScott Wu氏

以下はデモ動画からのキャプチャです。

Devinは人間のソフトウェアエンジニアと同様に、自身のコンソール画面(右上)、コードエディタ(右下)、Webブラウザ(左下)を持っています(左上は人間とチャットでやり取りする領域)。

Devinは自分のコードエディタやコンソール画面、Webブラウザを持っている

人間がプロンプトで何らかの課題を与えると、まず課題解決のためのプランを生成します。

課題解決のためのプランを作成

今回、Devinは必要とするAPIの情報をWebブラウザで参照し、情報を利用して開発を進めます。

DevinがWebブラウザでAPIの情報を参照

作業の途中でエラーが出力されると、Devinは関連しそうなコードの場所にデバッグ用のPrint文を挿入し、出力された内容からエラーの原因を探ります。

エラーコードをDevinが参照
関連しそうなところにPrint文を挿入

Devinは出力されたPrint文によるログからエラーの原因を分析し、自律的にデバッグを行います。

最終的にDevinはビルドとデプロイを行い、課題に対応したWebサイトを生成しました(左下のグラフの画面)。

Devinがビルドとデプロイを行い、Webサイトが完成

同社によると、実世界のソフトウェアの課題に関する大規模言語モデルを評価するためのベンチマークである「Real World Software Engineering Performace(SWE-bench)」で、Devinは他を圧倒する成績を示したとしています。

SWE-benchでDevinは他を圧倒する好成績を示す

GitHubリポジトリのReadmeを読んで環境を構築

別のデモ動画では、Devinに大規模言語モデルを量子化により効率よくファインチューニングする「QLoRA」を使ってLlamaのファインチューニングを依頼。

DevinはQLoRaのGitHubリポジトリをクローンし、Redmeを読んでPythonのパッケージ管理システムであるPIPを使って環境を構築。

実行時にCUDA関連のエラーが起きると、NVIDIAの環境を再インストールするなどして問題を解決。問題なくファインチューニングを完了させる様子が示されています。

Devinを発表したブログ「Introducing Devin, the first AI software engineer」には、その他Devinによるライフゲームの機能拡張、テストコードの生成など、Devinによる自律的なシステム構築やプログラミングの様子が紹介されています。

デモ動画の通りであれば、少なくとも初級プログラマよりもずっと優れているように見えるのではないでしょうか。

現時点でDevinはアーリーアクセス版となっており、興味のある人はウェイトリストからの申し込みが必要です。

GitHub Copilot Workspaceより自律的に見える

AIによる自律的なプログラミングは、GitHubも「Copilot Workspace」を昨年(2023年)11月に発表し、デモを披露しています。Copilot WorkspaceもDevinも、課題が与えられると計画を立てるところは似ています。

しかし今回のDevinはデモを見る限り、Readmeを読んでその通りに環境を構築するなど、Copilot Workspaceのデモよりもさらに自律的になっているように見えます。

参考:GitHub、Copilotの将来像となる「Copilot Workspace」発表。人間がコードを書くことなく、Copilotが仕様作成からコード作成、デバッグまで実行。GitHub Universe 2023

COMMENTS


Recommended

TITLE
CATEGORY
DATE
Fanicon、ファンサービスとITを結びつける新サービス・動きをまとめた「エンタメ ファンテック カオスマップ 2022」公開
IT関連
2022-01-26 20:38
日本生命、コールセンターシステム導入–オペレーターの受電件数を標準化
IT関連
2022-05-14 04:11
経理職が会社から消える? 進むデータ化、インボイスが拍車
IT関連
2021-06-30 19:41
マイクロソフトがワークフローを自動化するPower Automate DesktopをWindows 10ユーザーに無料で公開
ソフトウェア
2021-03-04 13:31
「コンビニおにぎり開けられない」海外レポーターの苦戦動画が130万再生 セブンは「きれいな開け方」ネットで公開 :東京五輪とネット(1/2 ページ)
企業・業界動向
2021-07-31 00:21
アカマイ、国内事業者向けでは過去最大規模のDDoS攻撃について解説
IT関連
2025-02-02 12:20
ミッチェル・ハシモト氏、HashiCorpを去る。「新しい分野に踏み出す準備ができた」
HashiCorp
2024-01-12 13:34
[速報]マイクロソフトとオラクル、「Oracle Database@Azure」発表。共同でAzure上でのOracle Exadataベースのマネージドサービスを提供
Microsoft
2023-09-15 01:28
顧客のビジネスイノベーションパートナーを目指して挑戦–富士フイルムBI・浜社長・CEO
IT関連
2023-01-08 21:27
イーロン・マスク氏が電動トラックTesla Semiの生産準備は整ったがバッテリー不足がネックと発言
モビリティ
2021-01-29 02:00
Twitter、米バイデン政権へのアカウント移行を無事完了 @POTUSは意気込みをツイート
社会とIT
2021-01-22 21:13
森永製菓、経理財務DXを推進–海外事業拡大やサステナブル経営に向けて
IT関連
2022-11-24 19:11
Zoom、AI本格投入でビデオ会議企業からの脱却を宣言–将来の展望は?
IT関連
2024-11-29 00:16
エレコム製ルーターに脆弱性、「ウマ娘」はGII以下で体操服……7月6日のITトレンドをサクッとおさらい :ほぼ日刊ITトレンドワード
ネットトピック
2021-07-07 18:58