AWS、自然言語による指示で面倒だったETLスクリプトを自動生成してくれる「Amazon Q data integration in AWS Glue」プレビュー公開

今回は「AWS、自然言語による指示で面倒だったETLスクリプトを自動生成してくれる「Amazon Q data integration in AWS Glue」プレビュー公開」についてご紹介します。

関連ワード (企業、回答、生成等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、Publickey様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


AWSは、ファイルやデータベースなどのデータソースからデータウェアハウスへデータを集積する際のデータ変換や転送処理などのスクリプトを、自然言語による説明から自動的に生成してくれる新サービス「Amazon Q data integration in AWS Glue」のプレビュー公開を発表しました。

figAWS re:Invent 2023でAmazon Q data integration in AWS Glueが登場することが予告されていた

Amazon Qは、昨年(2023年)11月に開催されたイベント「AWS re:Invent 2023」で発表された生成AIサービスです。このAmazon QをETLサービスであるAWS Glueと統合することも、AWS re:Invent 2023で予告されていました。

参考:[速報]AWS、Copilot対抗となる「Amazon Q」発表。生成AIによるシステム開発支援や業務支援など、多様なAIサービスを提供。AWS re:Invent 2023

多様なデータソースをまとめるETLスクリプトの作成は面倒だった

企業が顧客分析や売り上げ分析などを行う際には、顧客データや売り上げデータ、マーケティングデータなどのさまざまなデータを、分析しやすい形でデータウェアハウスに統合することが望ましいとされています。

しかしそれぞれのデータは、それぞれの業務向けデータベースやクラウドサービス、場合によってはファイルなどのさまざまな形式で保存されていることがほとんどであり、データウェアハウスに統合するには、そうしたデータソースから適切にデータを抽出し(Extract)、変換し(Transform)、転送する(Load)、いわゆる「ETLツール」が使われます。

しかし容易に想像できるように、さまざまなデータソースを適切に統合するには、ETLツールに対してきめ細かな操作を指定したスクリプトを与える必要があり、それは容易ではなく手間もかかります。

今回プレビューが開始された「Amazon Q data integration in AWS Glue」は、この面倒で手間がかかるETLスクリプトを、自然言語で指定するだけで生成してくれるというものです。

Amazon QがETLスクリプトを自動生成してくれる

Amazon Qで自然言語による指示でETLスクリプトが自動生成される具体的な例を「New chat experience for AWS Glue using natural language – Amazon Q data integration in AWS Glue (Preview)」から引用しましょう。

下記は、「Amazon Redshiftからデータを読み込んでNull値を省略した上で、Amazon S3にParquetファイル形式で書き込む」(Write a Glue ETL job that reads from Redshift, drops null fields, and writes to S3 as parquet files.)という指示をして、ETLスクリプトが生成されたところです。

fig

このとき、内部ではAmazon Bedrockによってプロンプトが適切に分割されて処理され、結果が統合されて出力されると、AWS re:Invent 2023では説明されていました。

データベース管理者や開発者は、Amazon Qによってこれまでよりも圧倒的に効率よくETLを実現できるようになることが期待されます。

Amazon Qと既存のAWSサービスとの連携が今後相次ぐだろう

AWSはAmazon Qを今回のETLスクリプトの生成だけでなく、デベロッパーライフサイクルのあらゆる場面で活用することで、生産性を高めることを明らかにしています。

fig

デベロッパーがAWS上でどんなアプリケーションを開発し、どんなデータベースを運用し、どんな業務を行っているのか、そうした情報を基に生成AIであるAmazon Qを活用することで、より精度の高い回答を提供することができます。

これがAWSにとって、ChatGPやマイクロソフトのCopilotに対する最大の優位性となります。

その優位性を活かした、Amazon Qと既存のAWSサービスとの連携が今後も発表されていくはずです。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
ソフトバンクG、一旦は破産申請した英OneWebに再投資 来年末までに648基の衛星群
企業・業界動向
2021-01-19 03:16
マイクロソフト、GPT-3.5やDALL・E 2のAIモデルを含む「Azure OpenAI Service」正式に提供開始。まもなくAzure上で学習させたChatGPTなども実行可能に
Microsoft
2023-01-18 04:45
オンプレミスの「VMware」環境をそのままクラウドに–「Oracle Cloud VMware Solution」の特徴と強み
IT関連
2024-07-12 22:23
東京五輪の開会式、生放送を見た人は約7062万人 ビデオリサーチ推計
くらテク
2021-07-27 11:29
データ主権要件に対応するソブリンクラウドと次世代AIサービスを提供–日本オラクル・三澤社長
IT関連
2025-01-10 15:55
Libryとカシオ、独自の試験問題を作成できるツールを提供–東京書籍ら出版社4社と提携
IT関連
2025-04-12 23:52
アドバンスト・メディア、LGWAN対応のAI音声認識文字起こしを開始
IT関連
2022-12-08 09:08
NRIセキュア、サプライチェーン/DX領域へのサイバー攻撃対策を強化
IT関連
2021-08-16 09:39
HPE、大規模/エッジ環境の機械学習を加速する新製品を発表
IT関連
2022-05-31 02:51
間もなく登場するOculus Quest 2はPCの無線ストリーミングに対応し仮想オフィスも実現
VR / AR / MR
2021-04-15 18:40
マイクロソフトがXboxやPC用ゲームのアクセシビリティをテストする開発者向けサービスを開始
ゲーム / eSports
2021-02-19 08:17
「夜に駆ける」MV、YouTubeの規制解除 一時は「攻撃的または不適切な内容含む」の表示に
ネットトピック
2021-06-02 23:53
蛾の触角をドローンに移植 匂いの発生源に向かって飛行する「Smellicopter」 :Innovative Tech
トップニュース
2021-03-21 21:54
コンテナランタイム「containerd 2.0」正式リリース、登場以来初のメジャーバージョンアップ。1.xとの互換性は維持
Docker
2024-11-12 22:56