「もっと早く知りたかった」、Gesundが医療アルゴリズム検証データを提供するために2.3億円を調達
今回は「「もっと早く知りたかった」、Gesundが医療アルゴリズム検証データを提供するために2.3億円を調達」についてご紹介します。
関連ワード (一部、使用、実績等) についても参考にしながら、ぜひ本記事について議論していってくださいね。
本記事は、TechCrunch様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。
医療アルゴリズムを開発することと、それが本当に機能することを証明することは、まったく別の話だ。そのためには、入手しにくいある重要なものが必要だ。医療データである。現在、とあるスタートアップ企業が、そのようなデータを、検証研究を容易にするツールとともに提供する準備を整えている。
今週、2021年に創業されたGesund(ゲズンド)が、500 Globalが主導する200万ドル(約2億3000万円)のシードラウンドでステルスから浮上した。CEOで創業者のEnes Hosgor(エネス・ホスゴー)氏はTechCrunchに対して、同社はすでに多くの実績を残していて、実行可能なプラットフォーム、30社の見込み顧客との取引、今四半期の売上見込みなどを見込んでいると語る。
基本的にGesundは、医療アルゴリズムを開発するAI企業や、自身のモデルをテストするアカデミアのためのCRO(Contract Research Organization、医薬品開発業務受託機関)なのだ。一般のCROが医薬品や医療機器企業向けの臨床試験をデザインするのと同じように、Gesundのプラットフォームは、AI企業が自社の製品をテストするためのデータをキュレーションし、その比較をスムーズに行うためのITインフラを構築する。
ホスゴー氏は「私たちは、自分たちを機械学習運用企業だと考えています」という。「私たち自身はアルゴリズムを手がけません」。
医療アルゴリズムは、学習させるデータがあってこそ役に立つが、多様で有用なデータセットの入手は困難であることが知られている。例えば、2020年にJAMAで発表された研究では、放射線科、眼科、皮膚科、病理科、消化器科などの分野にわたる深層学習アルゴリズムを説明した74の科学論文を分析し、これらの研究で使われたデータの71%がニューヨーク州、カリフォルニア州、マサチューセッツ州からもたらされたものだということを報告している。
実際、米国の34の州は、これらのアルゴリズムの学習に使用したデータを提供しておらず、より広い母集団に対する一般化の可能性が疑問視されている。
また、この問題は医療機関の種類を越えて存在している。大規模かつ権威ある大学病院で収集されたデータを使ってアルゴリズムを学習させることは可能だ。しかし、それを地域の小さな病院に導入しようと思っても、そうしたまったく異なる環境ではうまくいく保証はない。
BMJに発表された152件の研究のメタレビューによれば、アルゴリズムを訓練するために使用されるデータセットは、一般的に、必要とされるものよりも小さいという。当然ながら、アルゴリズムの成功例もあるものの、これは業界全体の問題なのだ。
テクノロジーだけでこれらの問題を解決することはできない。そもそも、そこにないデータを分類したり、提供したりすることはできないのだ。ヨーロッパ人以外の祖先を持つ人々の遺伝子研究が、非常に不足していることを考えてみて欲しい。しかしGesundは、既存のデータへのアクセスを容易にし、データ共有の新たな道を開くパートナーシップを構築するという、テクノロジーを役立てられる可能性のある問題に焦点を絞っている。
Gesundの検証プラットフォームの画面
Gesundのデータパイプラインは「各臨床施設と締結している、データ共有契約」に基づいているとホスゴー氏はいう。現在、Gesundはシカゴ大学医療センター、マサチューセッツ総合病院、ベルリンのシャリテ大学で収集された画像データにフォーカスしている(同社は今後、放射線医学以外の分野にも拡大する計画だ)。
機械学習アプリケーションで使用するためのデータの集約と配信は、Nightingale Open Science Project(ナイチンゲール・オープンソースプロジェクト)のような、研究者に臨床データセットを無料で提供する他の企業によっても行われている(物議を醸しているGoogleの「Project Nightingale」[プロジェクト・ナイチンゲール]とは提携していない)。だが、データそのものも重要な要素だが、実はホスゴー氏が秘密兵器と見ているのは、同社のテクノロジー・スタックなのだ。
「誰もがクラウドでML(機械学習)をやっています。ですが、一般的な医療機関はクラウドを持っていないので、すべてが失われてしまうのです」とホスゴー氏はいう。「そこで私たちは、病院のファイアウォール内に設置できる技術スタックを構築しました。これは機械学習にはつきもののサードパーティのマネージドサービスには一切依存していません」。
そこを起点として、プラットフォームには「ローコード」のインターフェイスが搭載されている。つまり、医師や医療機関は、基本的に必要なデータセットをドラッグ&ドロップし、そのデータに対して自身のアルゴリズムをテストすることができるのだ。
ホスゴー氏は「創業して約6カ月ですが、すでに本格的に走っています。私たちは開発した最初の製品は、クラウドリソースにアクセスできない高度なコンプライアンス環境において、モデルの所有者がデータに対して自身のアルゴリズムを実行し、正確なメトリクスをその場で生成できるようにするものです。それが私たちの強みなのです」と説明する。
現時点では、GesundはNightingaleと同様に、一部のサービスを無料で提供している。同社のCommunity Edition(コミュニティエディション)では、手持ちのアルゴリズムがある研究者たちが、自分たちのアルゴリズムを無料でテストできる(ただし、自分たちのデータセットをアップロードする必要がある)。
一方、同社の「プレミアム」版の費用を払うのは、AI企業だ。これによって、お金を払っている顧客は、独自のデータセットにアクセスできるようになるとホスゴー氏はいう。そして、必要なデータにはお金を払うという実績もある。現在、Gesundは30の潜在顧客との交渉中だとしていて、今期中に収益を上げる予定だという。
「私たちは2021年11月にシカゴで開催されたRSNAに出席しましたが、話を聞いたあらゆるAI企業から『ああ、もっと早く知りたかったです』という発言を聴きました」。
現在Gesundが調達した資金は今回の200万ドル(約2億3000万円)のプレシードラウンドだけだが、ホスゴー氏は2022年中に再び資金調達を行えることを期待している。近い将来、同社は研究開発に注力しつつ、米国および欧州における臨床提携を拡大する予定だ。
画像クレジット:Gesund
【原文】
It’s one thing to develop a medical algorithm, quite another to prove that it actually works. To do that, you need one crucial thing that’s hard to come by: medical data. And one startup is ready to provide that in spades, along with the tools to make validation studies easier.
Gesund, founded in 2021, emerged from stealth this week with a $2 million seed round led by 500 Global. The company has already come a long way, boasting viable platforms, 30 clients in their sales pipeline and revenue expected this quarter, CEO and founder Enes Hosgor told TechCrunch.
Gesund is basically a Contract Research Organization (CRO) for AI companies developing medical algorithms, or academics testing their own models. The same way a CRO might design a clinical trial for a drug or medical device company, Gesund’s platform curates data that allows AI companies to test their own products and creates the IT infrastructure to make that comparison run smoothly.
“I like to think of us as a machine learning ops company,” said Hosgor. “We don’t do algorithms.”
A medical algorithm is only as good as the data it’s trained on, and there is evidence that getting diverse and usable data sets can be a challenge. For example, a study published in JAMA in 2020 analyzed 74 scientific papers describing deep learning algorithms across disciplines like radiology, ophthalmology, dermatology, pathology, gastroenterology and pathology; 71% of data used in these studies came from New York, California and Massachusetts.
Indeed, 34 U.S. states did not contribute any data to the pipeline that had been used to train these algorithms, calling into question how generalizable they might be to a wider population.
The issue also exists across different types of healthcare providers. You could train an algorithm on data collected at a large, esteemed, academic hospital. But if you want to deploy that in a small community hospital there’s no guarantee it will work in that very different setting.
Taken together, the data sets used to train algorithms are, in general, smaller than they should be, according to one meta-review of 152 studies published in the BMJ. Naturally, there are some algorithmic success stories, but this is an industry-wide problem.
Technology alone can’t solve all these issues; you can’t sort or provide data that isn’t there in the first place. Think genetic studies for people of non-European ancestry, which are sorely lacking. But Gesund is focused narrowly on an issue where tech might help: making existing data easier to access and creating partnerships that open up new avenues for data sharing.
A screenshot of Gesund’s validation platform.
Gesund’s data pipeline comes from “existing data sharing agreements in place with clinical sites,” said Hosgor. Right now, Gesund is focused on imaging data collected at the University of Chicago Medical Center, Massachusetts General Hospital and Berlin’s Charité. (The company plans to extend beyond radiology in the future.)
Aggregating and delivering data for use in machine learning applications is also being done by others, like the Nightingale Open Science Project, which will freely provide clinical data sets to researchers (not affiliated with Google’s controversial “Project Nightingale”). But while the data itself is a critical piece of this, it’s really the technology stack that Hosgor sees as the company’s secret weapon.
“Everybody does ML on the cloud,” explained Hosgor. “And because your average healthcare provider doesn’t have a cloud, all that goes out the window,” he said. “We have built this technology stack that can reside on premises, inside a hospital firewall. It does not rely on any third-party managed services, which are the bread and butter of machine learning.”
From there, the platform includes a “low code” interface. In short, physicians and providers can basically drag and drop the datasets they need and test their own algorithms against that data.
“We’re about six months old, but we hit the ground running and we built this first product that allows model owners to run their algorithms against data to produce accuracy metrics on the fly, in high compliance environments where they don’t have access to cloud resources. That’s our secret sauce,” he explained.
At the moment, Gesund, somewhat like Nightingale, is providing some of its services for free. The company’s Community Edition allows academics with existing algorithms to test their algorithms for free (but they’ll have to upload their own data sets).
Meanwhile it’s the AI companies that will foot the bill for the company’s “premium” version. This, says Hosgor, will give the paying customers access to proprietary data sets. And there’s evidence they’ll pay for the data they need. At the moment, Gesund claims to have a pipeline of 30 potential clients, and expects to generate revenue this quarter.
“We were at RSNA in Chicago last November and every single AI company we talked to said ‘yes, I need evidence yesterday.’”
The $2 million pre-seed round represents all of Gesund’s funding, but Hosgor expects the company to raise again this year. In the near future the company will focus on R&D and expanding its clinical partnerships in the U.S. and Europe.
(文:Emma Betuel、翻訳:sako)