第1回:クラウドネイティブなデータ基盤設計とは

今回は「第1回:クラウドネイティブなデータ基盤設計とは」についてご紹介します。

関連ワード (CIO・情シス部長が知っておきたい「データクラウド」の基本と構造、ビッグデータ等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 デジタル変革(DX)や生成AIの普及が進む中で、企業が競争力を維持・向上させるためには、データの活用とそれを支えるデータ基盤の整備がますます重要になっています。AIの分野では「Garbage in, Garbage out(ゴミを入れればゴミが出る)」という言葉が示すように、データの質が成果に大きな影響を与えます。不正確なデータや品質の低いデータを使うと、業務で誤った判断をしてしまう可能性があります。そのため、データ基盤の重要性はさらに高まっています。

 近年、クラウドの利点を最大限に活用したデータ基盤として「データクラウド」の導入が注目されています。データクラウドは従来のデータ基盤とは異なる特徴を持ち、理解しておくべき重要なポイントが幾つかあります。

 この連載では、データクラウドについて企業や組織の最高情報責任者(CIO)や情報システム部長の皆さんが押さえておくべき重要な点を、以下の4つのテーマに沿って解説します。データクラウドの基本的な概念や構造を理解し、実際に導入する際に役立つ基本知識を身につけていただければと思います。

 クラウドネイティブなデータ基盤設計とは、クラウド環境に最適なデータ基盤を構築するためのアプローチです。クラウドの特性を生かし、スケーラビリティーや可用性、柔軟性、コスト効率を最大限に引き出します。従来のオンプレミス基盤やIaaS基盤とは異なり、設計時に考慮すべきポイントがありますので、以下に解説します。

 従来のオンプレミス/IaaS基盤は、事前にインフラのサイズを決定し(サイジング)、実装後は可能な限りそのサイズを維持しながらユースケースやワークロードの変更に対応するのが一般的でした。しかし、この方法では新たなユースケースやデータ量の増加に対応しにくく、リソースの競合が発生するという課題がありました。

 クラウドネイティブなデータ基盤では、小規模から始め、必要に応じてスケールアップやスケールアウトが可能です。データ量やワークロードが増加した場合、クラウドのスケーラビリティーを活用して基盤を拡張できます。最適な拡張を実現するには、基盤の利用状況をモニタリングし、適時にリソースを追加することが重要です。

 クラウドネイティブなデータ基盤を安全に利用するには、ガバナンス、セキュリティ、高可用性を考慮する必要があります。オンプレミス/IaaSの基盤では、設計時にこれらの要素を自社で考慮し、セキュリティ製品の組み込みや冗長化を行う必要がありました。

 一方、クラウドネイティブなデータ基盤の設計では、利用するクラウドデータ製品が取得しているセキュリティの認証(例:FedRAMP、 ISO27001)や高可用性機能(例:マルチアベイラビリティーゾーン〈AZ〉、クロスリージョン)を確認し、自社の要件に合致するかを見極める必要があります。全ての要件を満たすことが難しい場合は、複数の製品を組み合わせたり、独自に補完したりすることも選択肢となります。

 また、グローバルなデータ基盤を構築する際には、各国の法律に従った設計も必要です。特に、各国のデータ保護法(例:一般データ保護規則〈GDPR〉)に準拠するためには、データの所在を考慮した設計が求められます。例えば、GDPRに対応する場合、個人データを特定の国に留めたり、マスキングしたりする設計が必要です。

 データ基盤を構築した後も、機能を維持するためには定期的なアップデートやメンテナンスが必要です。オンプレミス基盤の時代には、数年ごとにインフラやソフトウェアの更新が必要で、保守費用が発生するのが一般的でした。

 クラウドネイティブなデータ基盤では、ソフトウェアやインフラのアップデートが自動で行われるため、従来のオンプレミスに比べてコストや手間を節約できます。データ基盤は進化し続け、新しいデータが追加されるため、データの検索速度(クエリーパフォーマンス)を維持し、最適化するためのチューニングが重要です。ビッグデータの増大・多様化により、チューニングの容易さも保守時の重要な考慮点となります。

 また、過去データのバックアップについても、クラウドネイティブなデータ基盤ではタイムトラベル機能を活用して効率的に保存できます。これらの機能を考慮することも設計時には重要です。

 オンプレミスからPaaS/SaaSへの移行により、自社でメンテナンスや保守すべき項目が大幅に減少します。ライセンスコストが安くても、メンテナンスや保守に多くの人員が必要なデータ基盤では、総所得コスト(TCO)が高くなり、結果として高コストな基盤になることに注意が必要です。

 クラウドネイティブなデータ基盤では、多くのユーザーが複数の事業部門からデータにアクセスすることが求められます。グローバル展開する場合には、さらに複雑なアーキテクチャーパターンの考慮も必要です。この際、データ基盤設計で重要なのはアクセス権の管理によるガバナンスです。営業やマーケティング、人事などの部門が扱う個人情報や従業員情報へのアクセスを適切に制御することで、情報漏えいのリスクを軽減できます。

 これを実現するためには、アクセス権の管理がしやすい基盤設計が重要です。個人情報などのデータがどこに伝搬され、どのように使用されているかを把握し、ユーザーに応じてデータをマスキング/トークン化して保護するクラウド製品を選ぶことが必要です。

 また、データガバナンスはデータ戦略と密接に関連しています。機動力のある分析を行いつつ広範なデータにアクセスさせる場合には、最小限の分析者に広範なデータへのアクセスを許可するか、安全性を重視してアクセスできるデータを最小限にし、広範なユーザーにデータ分析を行わせる環境を整えるかのアプローチが一般的です。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
NTT西、日本MSと協業–自治体DXで立ちはだかる壁にソリューション提供
IT関連
2023-05-24 07:33
AWS、臨床文書の生成を支援する医療ソフトウェア企業向けサービス発表
IT関連
2023-08-02 07:01
東芝、オンプレミスとクラウドストレージの連係でコストを30%削減
IT関連
2023-12-21 00:38
折り畳みディスプレイは弱点克服 次は「三つ折り」「ローラブル」?──モバイル端末の2021年を占う (1/3)
くわしく
2021-01-13 23:17
この3年で4回の著作権法改正、いったいどこがどう変わったのか 忘れられがちな改正内容を整理する (1/3 ページ)
くわしく
2021-08-06 08:52
栃木県宇都宮市、子供のスマホ「家庭でルールを」 時間制限の記述を変更
IT関連
2021-03-23 00:19
「PUI PUI モルカー」初のスマホゲーム 7月中に配信へ
くらテク
2021-07-02 01:52
ツルハホールディングス、CO2排出量可視化・削減サービス「アスエネ」導入
IT関連
2023-12-26 18:37
日立ら、設備ごとに再エネ利用100%を認定する委員会設立–業界の整備目指す
IT関連
2022-12-15 00:04
気付いたら、DX–「Slack」を軸としたディップの業務改善ストーリー
IT関連
2023-05-19 01:39
Sansan、中小企業向け名刺管理サービスを「kintone」と連携
IT関連
2023-06-13 06:25
マイクロソフト版「OpenJDK」ビルド「Microsoft Build of OpenJDK」の一般提供開始
IT関連
2021-05-27 05:34
インフルエンサーマーケ支援のトリドリが12億円のシリーズB調達、人材採用・プロダクト開発・プロモーションを強化
IT関連
2022-03-02 05:01
日本IBM、「IBM Cloud Satellite」などを開始
IT関連
2021-03-02 13:49