「Grok」に4つのAIコーディングテスト–驚きの好成績、理解しきれなかった課題は?

今回は「「Grok」に4つのAIコーディングテスト–驚きの好成績、理解しきれなかった課題は?」についてご紹介します。

関連ワード (オフトピック等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 Xがチャットボットを初めて発表した際、有料の壁が立ちはだかっていた。しかし、「TANSTAAFL(何も失わずに何かを得られることはない)」にもかかわらず、Xは最近、「Grok」を世界に公開した。そこで筆者は、プログラミングテストを実施してみた。

 筆者は、サービス名からしてGrokに興味をそそられていた。「Grok」という言葉は、私が大好きなSF作家の一人であるロバート・A・ハインライン(Robert Anson Heinlein)氏による造語である。

 ハインライン氏に夢中になり過ぎない程度に言うと、彼は社会規範に関しては非常にオープンな考えを持っていた。彼は力強い物語を書き、科学に関する素晴らしいテーマを物語に取り入れ、深い社会批評をしばしば作品に盛り込んだ。

 ハインライン氏は幅広い意味を持つ火星人の言葉として「grok」を生み出した。彼のSF小説「異星の客」で初めて登場したこの言葉は、「理解する」という意味で解釈でき、その理解のレベルは深く根本的である。AIチャットボットの名前としては完璧だろう。

 それでは、本題のプログラミングテストに入ろう。

 これは、AIがPHPプログラミングとWordPressプラグインの構築方法を知っていることを要求するコーディングテストである。このテストは、名前をランダムに並べ替えるツールが欲しいという妻からのリクエストから生まれたが、工夫が施されている。

 彼女は毎月、自身が運営するECサイトでユーザー参加型のマーケティング施策を実施しており、ランダムにユーザー名を抽出している。問題は、複数のプロジェクトを投稿したユーザーにはエントリーのチャンスが複数回付与されることだ。そのため、このランダム抽出では同一のユーザー名を管理し、結果の表示でその名前が隣り合わないよう調整する必要がある。

 最後に、コードは分かりやすいユーザーインターフェース(UI)を実現しなければならない。具体的には、ユーザー名を貼り付け、ボタンをクリックするだけで、結果のリストを得られる仕組みである。

 この課題をGrokに与えたところ、成功した。インターフェースは整然と配置され、機能的だった。そして最も重要なこととして、コードは目的通りに動作し、ユーザー名をランダム化し、同じ名前を分離した。このテストには合格点を与えよう。

 2つ目のテストは、あるユーザーから最初に報告された不具合を解決するものである。筆者が公開したコードは、ユーザーが入力した数値が有効なドル/セント通貨であるかどうかをテストするように設計されていた。筆者の間違いは、コードが整数のみを許可していたため、例えば5ドルの寄付は可能だが、5.25ドルの寄付は不可能だったことである。

 Grokは正規表現のコードをうまく書き換えてくれた。合格まであと一歩だったが、生成されたコードでは、有効な通貨単位である「.5」のような数値が許可されないため、不合格とせざるを得ない。「0.5」は許可されるが、全てのユーザーが小数点以下の数値にゼロを付け加えるわけではないだろう。

 また、二重変換を行うのにかなり非効率的なメカニズムを使用しており、数値に変換できない文字列を適切に処理することもできない。

 今のところ、1勝1敗である。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
ゆうちょ銀行、全国233店舗で「LINE WORKS」運用–顧客接点を強化
IT関連
2022-07-10 21:40
眼鏡専門店のパリミキ、CX管理ソリューションを導入–顧客のニーズに応えられる環境づくり
IT関連
2023-08-05 09:51
SAP、ビジネスのためのAI戦略打ち出す– Microsoftと提携
IT関連
2023-05-18 07:55
168年の歴史を持つリーバイスのAI、データ活用、デジタル変革–責任者に聞く
IT関連
2021-04-20 02:27
テクノロジーへの取り締まりが、今後の米国・中国間の競争の運命を握る
IT関連
2022-02-02 05:05
Sentropyがソーシャルメディア上の攻撃から人々を守るツールをローンチ、Twitterを皮切りに展開
パブリック / ダイバーシティ
2021-03-01 10:00
トランスパイラ「Babel」の開発チーム、資金難で寄付を募集 (1/2 ページ)
クラウドユーザー
2021-05-13 09:42
“骨盤”でランナーの弱点を見抜くサービス カシオとアシックスが3月に開始 専用「G-SHOCK」も
くらテク
2021-01-28 19:58
第41回:列伝1人目「カイゼン型ひとり情シス」
IT関連
2022-08-24 20:15
ロシアのハッカー、「ChatGPT」の制限回避を狙う–Check Pointが確認
IT関連
2023-02-14 22:51
「iPhone 16e」の「e」をめぐり、さまざまな推測が飛び交う
IT関連
2025-02-22 05:06
相次ぐランサムウェア攻撃、米国がロシアに対処を求め警告
IT関連
2021-07-09 13:11
南アフリカのVC企業Knife Capitalが資金52.5億円確保、シリーズB10〜12社への投資を計画
VC / エンジェル
2021-02-14 01:13
SambaNova、富岳で学習した「Fugaku-LLM」を「Samba-1 CoE」のエキスパートに
IT関連
2024-05-15 00:01