[レポート] 患者のエクスペリエンスとマーケティングのROI向上 – Alteryx Inspire 2019 #alteryx19

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

こんにちは、小澤です。

現地時間2019年06月10日〜2019年06月14日に米国ナッシュビルで開催されたAlteryxの年次カンファレンスイベント「Inspire 2019」。今回クラスメソッドからは計6人のメンバーが現地参加しています。

当エントリではイベント3日目に行われたセッション「Improve Patient Experience + Measure Digital Marketing ROI at AdventHealth」について、その内容をレポートしたいと思います。

セッション概要

当セッションの概要は以下の通りです。

セッションタイトル: Improve Patient Experience + Measure Digital Marketing ROI at AdventHealth (AdventHealthにおける患者の経験を改善し、デジタルマーケティングのROIを測定)

登壇者: Pritesh Kucheria, Senior BI Solutions Analyst Mandeep Saggu, BI Solutions Analyst – Intermediate Derrick Chen, Senior BI Solutions Analyst Troy Lu, BI Solutions Analyst – Intermediate

セッション概要: Like many healthcare organizations, AdventHealth was challenged in two key areas: getting the most out of their patient surveys and measuring marketing ROI. Using Alteryx, they were able to tackle both challenges to provide deeper insights into patient sentiment and marketing analytics. Attend this session to learn how AdventHealth was able to leverage text analytics to help them understand true patient sentiment and achieve and maintain patient satisfaction metrics to qualify for full Medicare reimbursement. In addition, hear how they were able to leverage a billion data points from various clinical data sources, combined with techniques in Alteryx like regex and fuzzy matching, to improve match rates and deliver over $100 million in ROI. (多くの医療機関と同様に、AdventHealthは2つの重要な分野に挑戦しました:彼らの患者調査を最大限に活用することとマーケティングのROIを測定すること。 Alteryxを使用することで、彼らは両方の課題に取り組むことができ、患者の感情やマーケティング分析についてのより深い洞察を提供することができました。 このセッションに参加して、AdventHealthがテキストアナリティクスを活用して真の患者の感情を理解し、メディケアの全額払い戻しの資格を得るために患者満足度指標を達成および維持するのに役立った方法を学びます。 さらに、正規表現やファジーマッチングなどのAlteryxの手法と組み合わせることで、さまざまな臨床データソースからの10億のデータポイントをどのように活用して、一致率を高め、1億ドル以上のROIを達成できるかを聞いてください。)

セッションレポート

本セッションは以下の2つをAlteryxで実現する、という内容になっています。

  • マーケティングの費用対効果を最大化するために複数システムで管理されている同一ユーザを特定する
  • 患者の満足度を向上させるためのアンケート解析

マーケティングのROI向上

医療業界におけるマーケティング施策のROIを計測するにはいくつかの困難がともないます。 キャンペーンを行った際に消費者がすぐに必要としているとは限りません。 また、必要なタイミングあっても必要なもの(治療に際していくべき医療機関)が異なるため、どのキャンペーンが有効であったかの判断も異なってきます。

これらを適切に計測するにはSalesforceに登録されたユーザ情報と各種電子カルテなどに登録された患者の情報を統合する必要があります。

そのために、Alteryxを使って患者情報の統合を図り、ROIの計測に利用します。

サンプルとしてJohn Smithさん(いったい誰なんだろ?)のデータを例に挙げています。 複数の異なるシステムに同一人物と思わしきJohn Smithさんが登録されていますが、住所やメールアドレスが異なる, 一部欠損値がある, などの差異が見受けられます。

この状態で同一患者の判定を行うために、最低3つ以上の属性が一致していれば同一人物と判断する仕組みとしたようです。

さて、これで同一人物の判定方法が決まったのであとはその通りのワークフローを実装して、と行きたいところですが、もう一つ問題があります。 先ほどのJohn Smithさんのデータにおける住所の項目を見てください。 Address、すなわち住所の項目が表記方法が一部異なっています。 これの例では住所のみですが、データ内容によっては他のにも同一だけど表記が異なっている可能性のある項目があるかもしれません。 こういった状況において、それらの整合性を取るためのツールが3つ紹介されます。

1つ目はおなじみ(?)RegExツールです。 正規表現を使って文字列がどのようなパターンになってるかを指定することで、いい感じに一部のみを取り出すことが可能です。 これを使うことで、同一データであるかを判定するのに必要な部分のみに絞った情報を取り出すことが可能です。

2つ目はStreet Geocoderツールです。

ん?こんなツール知らないぞ?と思った方も多いかもしれません。 「ジオコーダー」という名前の通り、緯度経度と住所の変換を行うようなツールです。 便利そうなツールですがなぜ、あまりなじみがないかというと(Alteryxに限らず)相互変換を行うためにはそれらの対応関係を持った情報が必要だからです。 そのため、日本で使うにはどこからかその情報を取得可能な状態にしてやる必要があるツールとなります。 これはアメリカのもの含めてAlteryxにプリセットでは含まれていないようです。

このツールの機能として、住所を正規化するというものがあります。 この機能を使うことで、いくつかの異なる表記の住所を統一可能です。

最後のツールはこちら、Fuzzy Matchツールです。

このツールは"曖昧な"マッチングを行うツールです。 と言われてもよくわからないですね。

例として「シークヮーサー」のような表記のパターンが大量にあるような単語について考えてみましょう。

アンケートで「好きな食べ物」で回答した人は様々な表記で記述します。 しかし、集計を行う際にはそれらはすべて同一のものとして扱いたいですね。

表記ゆれの他にも、略語や誤字脱字、定番のニックネームなど本来は同一のものとして扱いたいといったことは多々あります。

そういった時に利用するのがこのFuzzy Matchツールです。 このツールを使うとデータ中の"同じものっぽい"スコアを算出してくれます。 その性質を利用して、今回のアカウントのマッチングに利用しているというわけです。 (なお、Fuzzy Matchは個別の言語固有の性質に依存する自然言語処理のロジックを含むため、Alteryx 2019.2現在日本語には対応していません)

これらのツールを使った実際のワークフローは以下のようになっているとのことです。

さて、アカウント情報の統合が自動化可能になったことによる効果ですがなんと...

150万ドル以上もの効果が得られたとのことです!

患者の満足度向上

患者のアンケートを分析することで、満足度向上のための施策を考える仕組みを構築します。 これには、HCAHPS(Hospital Consumer Assessment of Healthcare Providers and System Servy)という公開データを利用します。 このデータは5段階評価の質問27項目からなるものです。 今回の分析対象となるのはこの数値の部分ではなく自由記入欄となります。

自由記入欄に書かれたテキストを分析してワードクラウドのシステムを作成します。 このシステムでは

  • 上部のプルダウンで絞り込み
  • 左上の親指でワードクラウドに表示する内容をPositive/Neutral/Negativeから切り替え
  • 単語を選択するとそのワードを含むコメントリストに右側が切り替わる

といった動きを実現しています。

この仕組みを実現するプロセスは3つのワークフローで成り立っています。

  • データを整形して自由記入欄の部分の取り出し
  • 感情分析を行ってPositive/Neutral/Negativeに分類
  • ワードクラウドを作成

自由記入欄の取り出しは基本的な機能を使ったシンプルなワークフローです。

感情分析ではRツールを利用します。 Rの"sentimentr"というパッケージを利用することでこれは簡単に行えます。 詳細は割愛しますが、数行~十数行程度のコードでこれが実現できています。

ワードクラウド用のデータを作成します。 こちらもRツールを使っており、文章を単語に分割したのち、不要な単語を除去しています。 英語は分かち書きするので、単語への分割が楽でいいですねw

ここまでで、最初に紹介したシステムに必要な要素の作成ができました。 しかし、文章は単純にPositive/Negativeに分類できるわけではなくより複合的な内容の場合もあります。 そこで、トピックモデルを利用していくつかの話題に分類する、というのを行います。

トピックモデルの作成にはPythonツールを利用します。 gemsimパッケージを使って利用可能なLDAという手法を用います。

結果としては、いくつかのトピックはいい感じだったけど、もっと分解したほうが良さそうなのもあったとのことです。

おわりに

Alteryx Inspire 2019のセッション「Improve Patient Experience + Measure Digital Marketing ROI at AdventHealth」のレポートでした。

ブレイクアウトセッション一発目の時間帯のセッションだったのですが、「お、これはなかなか高度な話にあたったな!」という感じの内容でした。

Alteryxには使いこなすがチョット難しい高度なツールやR, Pythonとの連携などいきなり手を付けるのはハードル高い...でもいつか使ってみたい、という要素も多々あると思いますが、そういったものを使いこなしている人たちが実際の現場でどのようにそれらを役立てているのかの参考になる内容だったかと思います。