1個1TBのデータを扱えるか――田辺三菱製薬、データ分析までの道のり

今回は「1個1TBのデータを扱えるか――田辺三菱製薬、データ分析までの道のり」についてご紹介します。

関連ワード (加工、時代、製薬会社等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、It Media News様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 1678年創業の「たなべや薬」をルーツに持つ田辺三菱製薬。医薬品の製造・販売を手掛ける大手製薬企業として、その名前は広く知られている。

 そんな田辺三菱製薬がデジタルトランスフォーメーション(DX)実現に向けて動き出した。その重要なインフラとして選択したのがクラウドプラットフォーム「Microsoft Azure」だ。

 田辺三菱製薬は、Microsoft Azure上に、DXを強力に推進するための2つのシステムを構築した。一つ目は、電子カルテや医療報酬明細書(レセプト)から得たデータを分析し、医薬品の価値を高めて販売促進に結び付けるためのデータ分析基盤だ。二つ目は、医薬品のスペシャリストとして病院などの医療現場に情報を提供する医薬情報担当者(MR)が収集した情報の蓄積と分析を行うための業務支援システムである。

 同社の小林弘幸氏(ICTマネジメント室ICTマネジメントグループ・グループマネジャー)は「製薬会社は規制業種であり、薬価など、国の施策の影響下にある。新薬の開発を怠れば収益は頭打ちになる。業務のあらゆる部分でデータを有効活用する仕組みを構築しなければ、DXの時代に生き残れない」と製薬企業におけるDXの取り組みが喫緊の課題であることを力説する。

(前編)

 1678年から医薬品の製造・販売を続ける老舗製薬会社・田辺三菱製薬は、生き残りをかけたデジタルトランスフォーメーション戦略の一環として、クラウドプラットフォーム「Microsoft Azure」上に、データ分析基盤と、医薬情報担当者が訪問先などで収集した情報の蓄積と分析を行う業務支援システムを構築した。

 ICTマネジメント室を中心としたプロジェクトメンバーの奮闘によって、会社のデジタル化は着実に前進している。そんな立役者たちの活躍ぶりとは?

1個で1TBになるデータを扱えるクラウド

 田辺三菱製薬では「リアルワールドデータ」と称される、電子カルテやレセプトから得られる患者の匿名化されたサンプルデータを外部から購入し、専門の部署が分析している。得られた分析結果をもとに、新薬開発、薬の安全性確保や販売の促進につなげることが目的だ。

 小林氏は、リアルワールドデータの解析で新薬開発が加速するなど、ビッグデータをビジネスに活用する環境が整いつつある、と感じている。

 同社では、分析能力を引き上げるため、他社製のクラウド上にデータ分析基盤の構築を進めていた。しかし、扱うデータの容量が大きく、期待するパフォーマンスが出ない状況に追い込まれていた。

 リアルワールドデータは、1人の患者が複数の病院に通院すると、その分だけ情報が重複し、処方された薬の数だけ新しいデータが生まれる。蓄積されたデータの容量は自ずと大きくなり、1つのファイルが1TBを超えることもめずらしくないというありさまだ。

SIer依存でブラックボックス化されたプロジェクト

 分析業務を行う各ユーザー部門は、システム構築については専門外だ。そのため、SIerに深く依存する形でプロジェクトを進めていた。しかし、SIerが推し進めていた当時の他社製クラウド環境では、大容量のファイルを扱うと、前述したようにエラーの連続でまともに動作しない状態が頻発していた。

 そのような経緯もあり、分析を担当するユーザー部門からICTマネジメント室グローバルインフラグループに応援の要請が舞い込んだ。要請を受けた同社の尾崎宏道氏(ICTマネジメント室グローバルインフラグループ・高度専門職)は、「プロジェクトがSIer主導で進む中、システム全体の中身やデータの保存先などあらゆる部分がブラックボックス化されており、ユーザー部門では手が出せない状況だった」と当時を振り返る。

 さらに、データ分析業務におけるコスト削減の視点でも、クラウドを活用した自前のデータ分析基盤の構築は急務だった。それまでは、医療データを販売する専門会社から高額なデータを購入していたからだ。

 「ある特定の医薬品における年齢別の患者数」という至って簡単なデータを取得するにも、外部企業に対し購入コストが発生していた。自前の分析基盤を構築していれば、このような簡単な統計データなら苦もなく取得することができるはずだ。まともに動くデータ分析基盤の構築は、DXを推進する同社にとって、最優先の課題だった。

Azure Databricksの柔軟性や扱いやすさを評価

 小林氏と尾崎氏は、今回のデータ分析基盤の構築において内製化への移行を推進した。「SIer依存体質がもたらす開発ノウハウ不足とブラックボックス化から脱却し、SIerに丸投げせず協業することで、スピーディーなシステム開発の実現を目指した」(小林氏)

 分析基盤の構築に着手するにあたり、まず考慮したのは、開発、運用コストを圧縮することだった。当初は、一般的なデータベースによるシステムも検討したが、「構築時や運用面でコスト的に不利だと判断し、まずは、大規模データの処理に定評のある別のシステムでの環境構築を考えた」(尾崎氏)と説明する。

 そこで、Microsoft Azureを含め複数のクラウドサービスの検討に着手。その中で「当社のような製薬会社のデータ分析基盤の構築には、分析プラットフォーム『Azure Databricks』が最も適していると判断した」(尾崎氏)という。決め手は、他社と比較して柔軟性や扱いやすさの点で優位な結果が出たからだ。特に、Azure Databricksオートスケーリング、オートターミネートといった機能において、使いやすさと高い柔軟性を誇っている点を評価した。

デジタル化が求められるMRの活動

 田辺三菱製薬は、「ZEUS」(Zoom on Effective Ultimate System、ゼウス)と名付けたMR支援システムを構築し2017年から稼働させている。ZEUSは、製品別売上データ、MRの活動データ、さらにはWeb閲覧データ、顧客情報を蓄積し、これらを活用することで顧客ニーズに沿った情報提供を行うことを目的としている。

 そして、進化した2代目ZEUSはMicrosoft Azure上で運用を始め、それまで蓄積したデータを分析する仕組みも実装された。「医師のニーズを把握し的確な情報提供に役立てたりできる」(小林氏)という。

機械学習も可能なシステム構築

 Microsoft Azure上に構築したシステムは、リアルワールドデータやZEUSのデータをデータ移動・変換システム「Azure Data Factory」経由でデータ分析基盤として構築したAzure Databricksに受け渡している。

 Azure Databricksで構築したデータ分析基盤上でユーザー部門が、SQLやPythonなどによるプログラムを走らせて分析している。尾崎氏は「近いうちに機械学習も可能にしたい」と意気込む。

 また、社内外から集めたデータは分析業務に利用している。ビッグデータ向けストレージ「Azure Data Lake Storage」から加工されたデータを、ユーザー部門が閲覧できる「Azure SQL Database」に出力する。それ以外にも、社内のオンプレミス環境にあるデータでMicrosoft Azureに転送できるものは各種情報処理に活用している。

 尾崎氏は以前の状態を振り返り、次のように語る。「当初は、社内の至るところにデータが散在しており、どこにどんなデータが存在するのか、俯瞰的に把握できていない状態だった。それらのデータを社外のデータと合わせて集約した。その上で、せっかく社内外のデータが集まるインフラを構築したのだから、他のことにも活用できるようにした」という。このコメントからも、Microsoft Azureにおけるシステム構築の柔軟性の高さがうかがい知れる。

 さらに、現在、検証中の案件として、高度なパフォーマンスが要求される創薬の分野向けに高性能計算ができる環境をCycleCloudで構築している。

データ分析基盤にはクラウド

 インタビューの最後に、小林氏は、データ分析の可能性と製薬会社におけるクラウドコンピューティングの重要性について次のように語る。「ハードウェアを使い、一度構築して運用を始めると簡単には廃止できない従来型のシステムにおいては、厳格な費用対効果の測定が求められる。しかし、データ分析における機械学習は、明確な結果や回答の予測が困難であり、費用対効果の算出が難しい場合がほとんだと思う。その意味で、データ分析基盤の構築にはスケーラビリティの高いクラウドコンピューティングが最適だ」という。

 尾崎氏も「クラウドをフル活用することで、社内や市場のニーズ変化に柔軟に対応できる。スピード感をもったシステム構築が可能な点も評価したい。また、Microsoft Azureのようなクラウドの世界は、技術領域が広範囲に渡り、各分野で極めて高い専門性が求められる。マイクロソフトは、こちらからの専門領域の要望に高度なサポートを提供してくれた」とメリットを実感している。

Copyright © ITmedia, Inc. All Rights Reserved.

COMMENTS


Recommended

TITLE
CATEGORY
DATE
マイクロソフト、「Windows」の隠し機能にアクセスできる社内ツールを誤って公開
IT関連
2023-08-05 11:01
人気映画やテレビ番組を活用して語学教育を行うEWAが5100万ダウンロードを達成、初の外部資金を調達
IT関連
2022-02-27 06:46
ウクライナ侵攻に乗じたフィッシングやマルウェア攻撃、グーグルが複数グループの活動警告
IT関連
2022-04-02 06:24
ロシアがInstagramのブロックを発表
IT関連
2022-03-13 01:44
トレジャーデータ、顧客データ基盤に意思決定機能群などを拡充–組織体制も強化
IT関連
2023-05-26 19:35
アマゾンは2020年に2億ものフェイクレビューをブロックしたがその責任から逃げる
ネットサービス
2021-06-18 01:08
日本のITとDXの意志決定におけるサステナビリティーの認識はまだ低い–ピュア・ストレージ
IT関連
2023-07-25 12:29
クラウドの次に来るのはエッジ–HashiCorp CEOと日本法人トップに聞く
IT関連
2022-10-14 11:10
みんなの銀行、データ分析基盤の導入で与信審査システムを高度化
IT関連
2022-09-16 11:21
「LegalForce」、「法改正リマインドサービス」開始–法改正に関連する情報を通知
IT関連
2023-03-11 03:07
大阪市とAWSジャパン、生成AI活用に関する協定を締結–責任あるAI利用を追求
IT関連
2023-09-13 20:27
日本製鉄、財務業務システムを刷新へ–自前システムからの脱却目指す
IT関連
2022-05-31 05:16
企業の福利厚生で使えるAI恋愛ナビのAillがJR西日本グループと連携、新しい出会いを創出する「食レポイベント」実証実験
IT関連
2022-03-09 03:12
アルテリックス、分析プロセスの自動化基盤をクラウドで提供
IT関連
2022-03-04 14:02