Claude Blog 日本語版
CLAUDE BLOG

Carta Healthcare が AI に臨床抄録者のように推論させる方法

How Carta Healthcare gets AI to reason like a clinical abstractor

Carta Healthcare が AI に臨床抄録者のように推論させる方法

新シリーズ How startups build with Claude では、ハイパーグロース企業が AI で業界をどう変革しているかを紹介します。この記事では、Carta Healthcare の臨床データ抄録プラットフォーム Lighthouse の開発から得られたエンジニアリング上の教訓と、AI を活用したシステムをスケールで構築する際にコンテキストエンジニアリングがモデル能力と同等に重要である理由を共有します。

The quick pitch
Name Carta Healthcare
Founded 2017
CEO Brent Dover
Stack Claude in Amazon Bedrock
Growth 過去3年間で10倍の成長、125以上の病院をサポート

臨床レジストリは、共通の診断、処置、または病態を持つ患者に関する標準化されたデータを収集します。病院はレジストリにデータを提出することで、アウトカムのベンチマーク、ケアのギャップの特定、品質改善の推進を行いますが、レジストリの価値はそこに投入されるデータ次第であり、そのデータの生成は見た目以上に困難です。

患者記録をレジストリに登録可能なデータに変換する作業は、臨床データ抄録と呼ばれます。訓練を受けた抄録者がカルテを読み込み、医師の記録を解釈し、矛盾する文書を照合し、記録が明確でない箇所では臨床的判断を適用します。通常のケースで60分、複雑なケースでは5〜6時間かかることもあります。大規模な医療システムでは、単一のレジストリプログラムだけで年間11,000時間以上の専門労働に相当します。

従来の自動化ツールではこのギャップを埋めることができませんでした。ルールベースのシステムやNLPは予測可能な文書を扱えますが、臨床言語が予測可能であることはまれです。同じ所見が、ある病院では構造化フィールドとして記録され、別の病院では自由記述テキストの中に埋もれていることもあります。エッジケースは増殖し、コンテキストが重要であり、間違えた場合のコストは悪いレコメンデーションではなく、レジストリ全体を損なう欠陥のある品質データです。

そのギャップこそ、臨床データ管理ソリューションである Carta Healthcare がスケールで解決するためにソフトウェアを構築した課題です。同社のプラットフォーム Lighthouse は、訓練を受けた抄録者と同じように臨床文書を横断的に推論するために Claude を使用しています。

その過程で発見したことは、同社のアプローチを根本から変え、AI をパイロットから本番に持っていこうとするすべてのチームにとってのブループリントを提供しました。

ルールベースの抽出から臨床推論へ

レジストリの抄録者が答える質問は、データベースへの単純なルックアップではありません。

例えば、「処置前の直近のグルコース値は何だったか?」という質問に答えるには、正確な処置開始時刻を把握し、それより前の検査値を見つける必要があります。「退院時にアスピリンは処方されたか?」には、退院後に患者が自宅で服用するために処方された薬と、入院中に投与された薬を区別する必要があります。

明白なアプローチは、これらの判断をルールで自動化することです。臨床医がどのように特定の所見を記録するかをマッピングし、そのパターンに基づいて抽出ロジックを構築し、スケールさせる。しかし、臨床文書にはそのアプローチが機能するほどの一貫性がありません。同じ臨床所見が、ある病院では構造化フィールドとして記録され、別の病院では臨床ノートの自由記述として記録されます。

Carta Healthcare の初期システムは、レジストリデータを自動的に抽出するために自然言語処理 (NLP) を使用していました。パターン認識は、臨床的判断を再現できないことが分かりました。

「Carta Healthcare が数年前にNLPで始めたのはまさにそこであり、LLMに移行した理由もまさにそこです」と、Carta Healthcare の Applied AI Applications Manager である Hannah Glaser は語ります。

推論を正しく行うことは極めて重要です。3人の抄録者が同じ心臓症例をレビューして、異なるが擁護可能な回答に到達することもあるからです。医師の記録はある方向を示し、画像検査は別の方向を示す。正しい回答には両方を比較考量する必要があり、それはルールで解決できる問題ではありません。

「AIシステムが理解しなければならないのは、訓練を受けた臨床抄録者が理解していること、つまり臨床言語をコンテキストの中で読み取る方法、文書間で矛盾するエビデンスを比較考量する方法、特定の処置日に対する時間的ロジックを適用する方法、そして曖昧さを扱う方法です」と Glaser は語ります。「体重が処置後に測定された場合、熟練した抄録者はそれが処置前体重としてカウントされないことを知っており、システムもそれを知っている必要があります。」

Carta Healthcare はいくつかのモデルを評価した後、Claude を選びました。

「臨床文書の理解と解釈に関して、同等の能力を示した他のモデルはありませんでした」と Glaser は語ります。