$ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii...

186
平成 28 年度国立研究開発法人日本医療研究開発機構研究費 創薬基盤推進研究事業 研究課題名:産学官連携研究の促進に向けた創薬ニーズ等調査研究 医療分野におけるビッグデータ 並びに ICTAI の利活用の最新動向 -創薬並びに個別化医療・先制医療への貢献の道を探る- 創薬資源調査報告書 平成 29 3 公益財団法人 ヒューマンサイエンス振興財団

Transcript of $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii...

Page 1: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

平成 28 年度国立研究開発法人日本医療研究開発機構研究費

創薬基盤推進研究事業

研究課題名:産学官連携研究の促進に向けた創薬ニーズ等調査研究

医療分野におけるビッグデータ

並びに ICT・AI の利活用の最新動向

-創薬並びに個別化医療・先制医療への貢献の道を探る-

創薬資源調査報告書

平成 29 年 3 月

公益財団法人 ヒューマンサイエンス振興財団

Page 2: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

本報告書は、国立研究開発法人日本医療研究開発

機構(AMED)の【創薬基盤推進研究事業】によ

る委託研究として、公益財団法人ヒューマンサイ

エンス振興財団が実施した平成 28 年度「産学官

連携研究の促進に向けた創薬ニーズ等調査研究」

の成果を取りまとめたものです。

発行元の許可なくして転載・複製を禁じます。

Page 3: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

i

はしがき

公益財団法人ヒューマンサイエンス振興財団(以下、HS 財団)創薬資源調査班は、調

査研究の更なる充実のため、従来の研究資源委員会及び創薬技術調査ワーキンググループ

が母体となり 2014 年度に新設され、2013 年度の研究資源委員会でのバイオバンク事業を

始め、2014 年度はコホート研究ならびにゲノム等の関連技術、そして 2015 年度は、ビッ

グデータの医療・ヘルスケアへの活用ならびにバイオマーカー研究におけるオミックス関

連技術について調査を実施し、個別化医療・予防医療並びに創薬へ向けた課題提供を行っ

てまいりました。

2016 年度の行政動向として、政府の日本再興戦略改訂 2016 では、第 4 次産業革命とし

て IoT・ビッグデータの活用ならびに人工知能の研究推進が示され、未来投資会議では、

ビッグデータや人工知能(AI)を最大限活用した質の高い医療の推進に向けた施策の具体

化の指示がなされ、それらを踏まえ、健康・医療戦略推進本部では、医療分野研究開発推

進計画の見直しの中で、ICT 利活用についての大幅な改定が行われた。まさに、2016 年

は ICT やビッグデータの利活用推進に向け、大きく動きだした年であったと言えます。ま

た、AI につきましては、あらゆる産業で注目されており、医療・ヘルスケア分野におきま

しても、癌治療支援への活用、健康医療情報・モバイルデータ等のデータ分析、健康医療

サービス支援、創薬支援など、異業種にまたがり、その期待が高まっております。しかし、

これらビッグデータ、ICT ならびに AI を、医療、次世代の予防・先制医療、医薬品開発

へ効率よく活用していくためには、各データの標準化、情報加工、情報管理などにおける

科学面、倫理面、規制面などあらゆる側面での対応ならびに AI に関連する周辺技術等の

整備が急務であります。

本調査では、各分野における著名な学識経験者の先生方や機関、企業等を選定し、ヒア

リングを行い、報告書としてまとめました。第 1 章では、総論として創薬研究へのビッグ

データならびに AI の活用の現状と可能性について概説し、先制医療やマイクロバイオー

ムについても簡単にふれ、第 2 章にて、各事例として、電子カルテなどの医療情報の標準

化ならびに利活用の現状、医療情報・モニター情報の医療応用に向けた臨床研究、AI の癌

治療への応用ならびに創薬への応用の可能性とそれらに関わる課題について、またデータ

駆動型創薬研究としてオミックス情報を用いたドラッグリポジショングや遺伝統計、さら

に現在注目されております腸内細菌についても予防医療・未病治療へのビッグデータの活

用例の一つとして取り上げました。また、第 3 章では、ICT 関連ならびにゲノム医療関連

の行政動向ならびに産業社会動向についても概説しました。なお、本調査は、平成 28 年

度日本医療研究開発機構研究費(創薬基盤推進研究事業)「産学官連携研究の促進に向けた

創薬ニーズ等調査研究」の一環として実施したものです。本報告書が、関心のある関係各

位の方の参考になり、より一層の科学並びに医療の発展に寄与できることを期待しており

ます。

最後になりましたが、御多忙にもかかわらず本調査にご協力頂いた学識経験者の先生方、

企業の皆様、また調査活動全般にわたり協力して頂きましたヒューマンサイエンス振興財

団創薬資源調査班の方々、また、本報告書の作成にあたりサポート頂いた株式会社シード・

プランニングのスタッフに深く感謝申し上げます。

Page 4: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

ii

本調査にご協力いただいた学識経験者及び機関

(敬称略、所属機関 50 音順、所属はヒアリング実施時点)

水口 賢司 国立研究開発法人 医薬基盤・健康・栄養研究所

バイオインフォマティクスプロジェクト プロジェクトリーダー

山西 芳裕 九州大学 生体防御医学研究所

附属生体多階層システム研究センター システムコホート学分野 准教授

山田 亮 京都大学 大学院医学研究科附属ゲノム医学センター統計遺伝学部門 教授

岸本 泰士郎 慶応義塾大学 医学部 精神・神経科学教室 専任講師

福田 真嗣 慶應義塾大学 先端生命科学研究所 特任准教授

福田 悠平 経済産業省 商務情報政策局生物化学産業課 課長補佐

堀本 勝久 国立研究開発法人 産業総合技術研究所

創薬分子プロファイリング研究センター 副センター長

内田 和彦 筑波大学 医学医療系 准教授

田中 博 東京医科歯科大学 名誉教授

東北大学 東北メディカル・メガバンク機構 機構長特別補佐

山田 拓司 東京工業大学 生命理工学院 准教授

大江 和彦 東京大学 大学院医学系研究科 医療情報学分野 教授

宮野 悟 東京大学 医科学研究所 ヒトゲノム解析センター 教授

脇 嘉代 東京大学 大学院医学系研究科 健康空間情報学講座 講座長

川口 克己 日本アイ・ビー・エム株式会社 ワトソン事業部ヘルスケア事業開発部 部長

溝上 敏文 日本アイ・ビー・エム株式会社 ワトソン事業部ヘルスケア事業開発部 部長

徳増 玲太郎 日本アイ・ビー・エム株式会社 ソフトウェア&システム開発研究所

第二ワトソンサービス

堂田 丈明 株式会社 Preferred Networks 最高知財責任者

ハムザウィ カリーム 株式会社 Preferred Networks ビジネス開発

大野 健太 株式会社 Preferred Networks エンジニア

Page 5: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

iii

ヒューマンサイエンス振興財団 創薬資源調査班メンバー

(敬称略、50 音順、所属は 2017 年 3 月時点)

【班メンバー】

瀬戸 孝一 (リーダー) ゼリア新薬工業(株)中央研究所 医薬開発研究部

杉崎 肇 (サブリーダー) (株)エスアールエル 技術開発部

鈴木 雅 (サブリーダー)

田辺三菱製薬(株)渉外部付

(日本製薬工業協会医薬産業政策研究所出向中)

西村 健志(サブリーダー) 日本新薬(株)東京支社

根木 茂人(サブリーダー) エーザイ(株)メディスン開発センター

天野 賢一 持田製薬(株)総合研究所 企画提携

有岡 伸吾 塩野義製薬(株)グローバルイノベーションオフィス

伊東 尚浩 興和(株)東京創薬研究所 創薬探索研究部

小田 吉哉 エーザイ(株)hhc データクリエーションセンター

河合 隆利 エーザイ(株)メディスン開発センター

瓦井 裕子 大日本住友製薬(株)研究企画部

北川 誠之 旭化成ファーマ(株)診断薬製品部

木原 哲郎 東京医科歯科大学 リサーチ・ユニバーシティ推進機構

小紫 俊 大正製薬(株)医薬事業部門

佐々木 康夫 (公財)静岡県産業振興財団 ファルマバレーセンター

伊達 睦廣 和光純薬工業(株)臨床検査薬研究所

田中 弘一郎 藍野大学 医療保健学部

中田 勝彦 参天製薬(株)法務グループ コンプライアンスチーム

濱里 史明 (株)日立製作所 研究開発グループ

((株)日立ハイテクノロジーズ出向中)

東本 浩子 (株)エスアールエル カスタマーサービス室

本間 央之 協和発酵キリン(株)研究開発本部

【アドバイザー】

清末 芳生 ビジネスコンサルタント

具嶋 弘 (株)久留米リサーチ・パーク

【事務局】

五十嵐 夕子(事務局) (株)シード・プランニングリサーチ&コンサルティング部

山崎 三佳 (事務局) (株)シード・プランニングリサーチ&コンサルティング部

加藤 正夫 (事務局・研究開発分担者)

(公財)ヒューマンサイエンス振興財団 研究企画部

Page 6: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

iv

目次

ページ

はしがき ⅰ

本調査にご協力いただいた学識経験者及び機関 ⅱ

ヒューマンサイエンス振興財団 創薬資源調査班メンバー ⅲ

目次 ⅳ

第一章 ビッグデータ、人工知能、予防・先制医療の基盤技術の動向

はじめに 1

(1)医療ビッグデータと Precision Medicine -AI を用いた創薬と

マイクロバイオーム研究の現況と今後の方向性- 2

(2)コホート研究からの認知症の血液バイオマーカー発見と先制医療

に向けた新規検査法の開発 13

第二章 ビッグデータ、人工知能、マイクロバイオーム等の創薬ならびに

予防・先制医療への利活用

第 1 節 臨床情報の創薬への利活用

はじめに 19

(1)医療情報やウエアラブル機器からのデータを先制(予防)医療や

創薬に活用する可能性と今後の課題 21

(2)モバイル環境における新しい医療

-医療用アプリの臨床応用への課題と展望- 29

(3)プロジェクト「PROMPT」の概要

-医療(解析センサー)機器や解析手法の特徴および人工知能活用の実際 41

(4)個人情報保護法等の改正に伴う研究倫理指針の見直しについて 48

第 2 節 オミックスデータからの創薬

はじめに 60

(1)ビッグデータ解析における遺伝統計学の役割、及び個別化医療への

活用に関する展望と課題 62

(2)各種ビッグデータの解析からの新規創薬標的分子の探索や

ドラッグリポジショニングへの活用の現状と今後の課題 73

(3)オミックスデータを活用する創薬の IT ブースティング 87

第 3 節 マイクロバイオーム創薬のアプローチ法

はじめに 98

Page 7: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

v

(1)マイクロバイオーム研究からの先制医療や創薬への展望及びその課題 99

(2)マイクロバイオーム・メタゲノム関連データ解析の現状と

創薬や先制・予防医療に向けた今後の課題ならびに将来展望 110

第 4 節 人工知能の創薬への利活用

はじめに 117

(1)IBM Watson の医療および創薬への活用 119

(2)創薬への人工知能(AI)の活用:医薬基盤研での取組み 129

(3)ゲノム解析の今後の鍵となる基盤技術である人工知能について、

人工知能研究の現状並びに将来への課題 137

第三章 行政、社会、産業界の動向

(1)ICT を活用した健康・医療推進に向けた行政の取組み 146

(2)健康・医療分野における ICT 活用の産業・社会動向 153

(3)ゲノム医療実現へ向けた行政の取組み 159

(4)コホート研究ならびにゲノム技術等における研究動向 162

第四章 考察 167

第五章 提言 176

Page 8: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第一章 ビッグデータ、人工知能、予防・先制医療の基盤技術の動向

- 1 -

第一章 ビッグデータ、人工知能、予防・先制医療の基盤技術の動向

はじめに

ヒューマンサイエンス振興財団創薬資源調査班では、これまでに、コホート研究から、

オミックス解析、バイオマーカー研究、臨床情報などのビッグデータ解析まで幅広く取り

上げ、先制医療・予防医療ならびに個別化医療に資する“ビッグ-データ”の活用に注目し

てきた。近年、医療分野に限らず、ビッグデータ解析で注目されているのが人工知能

(artificial intelligence、AI)であり、あらゆる分野でその応用が進められている。

本章では、AI を医療や創薬研究へ如何にして活用していくか、医療ビッグデータ解析、

AI の医療・創薬への応用について、東京医科歯科大学の田中博名誉教授にヒアリングを行

い、簡単に概説した。また、細菌のメタゲノム解析、メタボローム解析や臨床データ解析

などのビッグデータ解析から疾患関連性が明らかになりつつあるマイクロバイオームにつ

いても、その創薬への可能性についても簡単に言及した。なお、AI の活用事例、産業動向

について、またマイクロバイオームの詳細については、次章を参考にしてもらいたい。

一方、先制医療においては、コホート研究からの成果は重要となるが、先制医療という

医療概念が提唱されてから、実用化に至った事例はないといっていい。にもかかわらず、

未だ先制医療への期待は絶えない。その中で、本章では、コホート研究から新たな認知症

の血液バイオマーカーを発見し、これを基に軽度認知症(MCI)の簡便なスクリーニング

法を開発した研究成果について、筑波大、内田和彦准教授に話を伺い、その成果と認知症

の予防の可能性について言及した。

第一章関連ヒアリング先とヒアリング概要

ヒアリング先 概要

1

東京医科歯科大学

田中 博 名誉教授

(東北大学

東北メディカル・メガバンク

機構長補佐)

「医療ビッグデータと Precision Medicine -AIを用

いた創薬とマイクロバイオーム研究の現況と今後の方

向性-」

医療のビッグデータ革命により生じるバラダイム転

換、現代社会における医療・ヘルスケアで AI が活用さ

れようとしているという点、並びに今後の創薬への活

用の可能性について。さらに、マイクロバイオームの

基本的意義、重要性と、今後の創薬のターゲットとし

ての可能性について解説。

2 筑波大学医学医療系

内田 和彦 准教授

「コホート研究からの認知症の血液バイオマーカー発

見と先制医療に向けた新規検査法の開発」

茨城県利根町と筑波大学が協力して 2001 年から 2012

年にかけて地域住民を対象にして行った利根町コホー

ト研究において、新たな認知症血液バイオマーカーを

発見し、これを基に軽度認知症(MCI)の簡便なスク

リーニング法を開発した。現在までに 1,500 以上の医

療機関で採用され、9,000 件以上の検査実績がある。コ

ホート研究からの予防医療・先制医療への取り組みと

もに現在の研究成果について解説。

Page 9: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第一章 ビッグデータ、人工知能、予防・先制医療の基盤技術の動向

- 2 -

〔1〕 医療ビッグデータと Precision Medicine

- AIを用いた創薬とマイクロバイオーム研究の現況と今後の方向性 -

ヒアリング先:

東京医科歯科大学名誉教授

東北大学東北メディカル・メガバンク機構

機構長特別補佐 田中 博 先生

要約

従来の医療ビッグデータのイメージは多人数の医療情報・疫学情報を統計処理すること

を意味したが、近年の分析機器の進歩によりゲノム・オミックス情報や生体センシングに

よるデータなど各個人ごとの情報も増大し医療ビッグデータの範疇が変わった。この結果、

例数を多く集め集合的法則を見出す「population medicine」の方法から、層別情報・個別

情報に基づいて医療を行う「personalized medicine/precision medicine」へとパラダイム

変換が進みつつある。言い換えれば、個人の遺伝素因・環境要因に合わせた医療が可能と

なりつつある。

ビッグデータの処理に関しては、現在、人工知能(AI)への期待が高まっている。Deep

Learning という革命的な学習方法が登場し、個別化・層別化医療や創薬への応用が進んで

いることに注目する必要がある。AI の導入により、ヒトにおける有効性や安全性の予測精

度が向上し、医療や新薬の適格性の向上に資するものになっていくであろう。

また、医療ビッグデータは、創薬や臨床試験におけるパラダイム変換ももたらし、従来

からの Randomized Clinical Trial が Real World Data と、疾患レジストリーやバイオバ

ンクを活用した治験に置き換わる可能性もある。

一方、最近注目されているのが腸内細菌叢(マイクロバイオーム)である。マイクロバ

イオーム研究は次世代シーケンサーの普及によりメタゲノム解析が進展、腸内エコシステ

ムの細菌菌種の多様性や、そのバランスが崩れる、「dysbiosys」により多くの疾患が発症

進展することが解明されつつある。腸内細菌そのものを対象とするのではなく、免疫系・

代謝系に働く腸内エコシステムとし捕らえる、新しい創薬の方法論が議論されている。

1. はじめに

大量データの急激なコストレス化と高精度化により医療ビッグデータの時代が到来し、

個別化医療・予測医療、健康管理や・医療全般の適確性が飛躍的に増大しつつある。

田中先生には、2015 年度においては医療ビッグデータ全般の収集や解析の現状と将来展

望についてヒアリングさせていただいたが1)、今回は、医療のビッグデータ革命により生

じるバラダイム転換、とりわけ創薬のパラダイム転換について解説いただくとともに、AI

とマイクロバイオームに焦点を置き、AI では、歴史的な変遷を概説頂き、現代社会におけ

る医療・ヘルスケアですでに AI が活用されようとしているという点、並びに今後の創薬

への活用の可能性を、マイクロバイオームについては、基本的意義、重要性を整理頂き、

Page 10: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第一章 ビッグデータ、人工知能、予防・先制医療の基盤技術の動向

- 3 -

今後の創薬のターゲットとしての可能性およびアプローチ法について解説頂いた。

2. 医療ビッグデータ革命

医療ビッグデータは数多くの個体の医療情報・疫学情報集める「Population Medicine」

型だけではなく、1個体の網羅的分子情報を集める「Precision Medicine」型のデータが

加わり“医療ビッグデータ革命“と言っても良いような変化が起こりつつある。

医療のビッグデータ革命とは、図 1 に示したように従来の縦長のビッグデータを解析す

るのでなく、新しい型の横長の個体別のビッグデータを解析することであり、新しいデー

タ科学が必要とされている。

図1.医療の「ビッグデータ革命」

(東京医科歯科大学/東北大学・田中博氏提供資料)

従来の医療情報のビッグデータではデータ集積の際には属性数が 10 項目程度の少数で

あるが個体数は膨大となる傾向であったが、新しい種類のビッグデータの性格としては、

個体数は比較的少ないながら、属性数が相当に拡大する傾向があり、従来の統計学ではそ

の解析が無効となる場合が多い。また、臨床診療情報や社会医学情報では個々のデータを

集めて集合的な法則を見ようとしているのに対して、新しいタイプの医療ビッグデータで

は大量にデータを集めて「個別化パターン」の多様性を捕捉するのに適している、すなわ

ちデータから個別性を見出そうという狙いが考えられる。ここにおいて、新しいデータ科

学が必要となっており、医療のビッグデータ革命ともいえる時代が到来している。

この革命は現在の動きから、以下の 3 つの既存のパラダイムの転換に挑戦しつつあると

考えられる(図 2)。

① Population medicine のパラダイム転換

② Clinical research(臨床研究)のパラダイム転換

③ 創薬の戦略パラダイムの転換

Page 11: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第一章 ビッグデータ、人工知能、予防・先制医療の基盤技術の動向

- 4 -

図2.医療の「ビッグデータ」革命によるパラダイム転換

(東京医科歯科大学/東北大学・田中博氏提供資料)

①は「One size fits for all」の概念から脱却し、前述のように個別化、層別化パタン

を網羅的に分析して個別化、層別化医療に繋げようとしている。②はまだ決定的ではない

状況ではあるが、従来型 Randomized Clinical Trial(RCT)は個別化医療の概念から見る

と破綻に近づいているように思われ、無作為標本化の呪縛から解放されるべき段階にきて

いるという考え方が出ている。ここでは Real World Data を見るための、ビッグデータか

らの知識生成(BD2K, big data to knowledge)が提唱されている。③ではビッグデータ

創薬の可能性は以前より主張されてきたが、最近では網羅的分子データからの計算機創薬

としてシステム創薬が発展しつつある傾向にあり、さらには Transdisease Omics や Drug

network の Dual Network Topology による創薬の試みも緒に就いているようである。

新しい型のビッグデータはまず次世代シークエンサーによってもたらされ、その後ゲノ

ム・オミックス医療の流れが加速した。米国では、電子カルテの情報から臨床表現型を分

類し、遺伝情報と統合することで新しい医療を提供するプロジェクト、electronic Medical

Record Genome (eMERGE)計画が進んでいる。医療におけるデータ科学の充実を図るた

め、Center of Excellence (COE)の創設、人材養成のための予算措置などが行われており、

オバマ前大統領の掲げる Precision Medicine Initiative が具現化されつつある。

Precision Medicine とは、図 3 に示したように、遺伝素因と環境・生活(生活習慣)素

因を組み合わせた Tailor made 医療であり、One size fits for all の Population 医療とは

異なる。Personalized Medicine とは基本的な概念は変わらないが、医療ビッグデータ時

代の到来により概念が拡張され、層別化を明確にしている点が異なる。また、Precision

Medicine の実現には、ゲノムコホートや Biobank が必要かつ重要な役割を果たすことに

なる。国内においては東北メディカルメガバンクにおいて、主に健常者の参加者に関して、

生活習慣情報などが付随した生体試料の採取・配布を実施しているが、患者の臨床材料の

採取・配布に関しては、いくつかの課題が残されているのが現状である。

Page 12: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第一章 ビッグデータ、人工知能、予防・先制医療の基盤技術の動向

- 5 -

図3.Precision Medicine の概念

(東京医科歯科大学/東北大学・田中博氏提供資料)

3. Real World Data を用いた創薬育薬の戦略

処方の実態や治療効果、副作用などを、実臨床で得られるデータから検証するリアルワ

ールドデータまたはリアルワールドエビデンスの議論が高まっている。臨床試験の将来の

あり方についても、個別化医療の概念の普及に伴い、現在臨床試験の検証的位置づけで採

用されている RCT は真の医療実態を反映していないという現実があり、RCT の限界が見

えてきている。すなわち、大半の RCT は「人工的な環境」で実施されており、また高齢

者、妊婦等の特殊集団は含まれないことが多く、さらに欧米での臨床試験では均一な人種

や年齢集団が含まれていないことが多いという実態がある。今後の課題としてはできるだ

け Real world data を反映させた集団での臨床試験を実施するなど、将来にむけた臨床試

験のためのプラットフォーム作りが必要な時期にきていると思われる。我が国では臨床試

験については決定的な方針は示されていないが、議論を深めながら段階的な移行を進めて

いく必要があると考えられる(図 4)。

図4.個別化(層別化)医療の概念の普及:RCT の限界と RWD 時代の到来

(東京医科歯科大学/東北大学・田中博氏提供資料)

Page 13: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第一章 ビッグデータ、人工知能、予防・先制医療の基盤技術の動向

- 6 -

Real world data を反映させた集団の臨床試験としてバイオバンクや疾患レジストリー

を活用した試験がスウェーデンで試みられている。疾患レジストリーの登録患者から該当

する臨床試験に適した患者選択を行い、選んだ集団で治験薬・対照薬を無作為に割付け、

臨床試験のエンドポイント達成評価を疾患レジストリーの追跡によって観測する(図 5)。

従来型の RCT との折衷案的な方法だが、興味ある試験方法である。

図5.バイオバンク・疾患レジストリーに準拠した治験

(東京医科歯科大学/東北大学・田中博氏提供資料)

4. 人工知能の利用による医療・創薬のパラダイム転換

最近取り上げられることが多い AI であるが、医療分野におけるデータの増大に対して計

算能力の増大とともに AI による知的処理が期待されている(図 6)。

図6.人工知能への期待

(東京医科歯科大学/東北大学・田中博氏提供資料)

Page 14: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第一章 ビッグデータ、人工知能、予防・先制医療の基盤技術の動向

- 7 -

医療分野における AI 活用の歴史については、①記号(シンボル)的知識の処理と②ニ

ューロネットワークの処理の両面から、1970 年代頃からの動きとしてその流れを図 7

に示した。

図7.医療分野での人工知能の歴史

(東京医科歯科大学/東北大学・田中博氏提供資料)

①の動きとして一つの変化は 1990 年頃 知識発見、機械学習の概念が示され、診断知

識のデータベースからの学習の動きが出始めたことである。機械学習は米国での動きが盛

んで米国臨床がん学会(ASCO)の CancerLin Q initiative や IBM Watson のがんセ

ンターへの普及、さらには患者の個別症例と最新の知識を更新し、個々の患者の donate

your data 登録ができる Cancer Common initiative などの研究が盛んである(図 8)。

図8. ビッグデータに対する機械学習の必要性

(東京医科歯科大学/東北大学・田中博氏提供資料)

Page 15: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第一章 ビッグデータ、人工知能、予防・先制医療の基盤技術の動向

- 8 -

また、②については Perceptron(人工的ニューラルネットワーク)Back Propagation

(逆伝播ニューラルネットワークにおける教師あり学習アルゴリズム)が 1970~80 年代

に検討されてきたが、しばらく停滞の後、深層学習(Deep Learning)の考え方が登場し

た。Deep Learning は上述の機械学習の限界を克服し、これまでの人間が正解を与える「教

師あり学習」を使用せず、ビッグデータからデータの特徴を学び、それらを用いて「課題

解決」を行う(図 9)。

図9.Deep Learning の登場

(東京医科歯科大学/東北大学・田中博氏提供資料)

医療分野においては AI の診療への適用の期待が高まっており、ビッグデータの解析に

向けて、AI の利用が進展している。その方法には数理的知識処理(データマイニグ、探索

統計学の数理的枠内で次元縮約)と、ニューロネットワーク(Deep Learning による特徴

量抽出を用いた次元縮約)の 2 つがある。

IBM Watson は、Deep Learning とは違った AI 技術であるが、画像処理やテキストマ

イニングも可能で、いくつか米国のがんセンターで活用されている。

創薬における AI は、①標的分子選択と妥当性検証;適切な分子標的の選択、②Virtual

screening;ヒット化合物に対する確証取得やクラス判定、リード化合物の最適化、構造活

性相関の反復学習、③システム薬理学;ネットワーク病態学よりの創薬戦略策定、④その

他 (毒性, 副作用予測等)、に活用されると予想される。その他、近年の AI 創薬における

話題としてすい臓がんの治療薬を AI を活用して開発する動き(米国 Berg Health)や、

AI ロボットによる library screening(マンチェスター大学)等も進められている(図 10)。

Page 16: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第一章 ビッグデータ、人工知能、予防・先制医療の基盤技術の動向

- 9 -

図10.最近の AI 創薬の話題

(東京医科歯科大学/東北大学・田中博氏提供資料)

5.マイクロバイオームと創薬

次世代シーケンサーの普及によりメタゲノム解析が可能となり、菌種の同定のみならず

細菌叢のプロファイル同定も可能となって、マイクロバイオーム研究が飛躍的に進展した。

腸内細菌の代謝産物に関しても研究が進展しており、腸内細菌が代謝して出す種々の物質は

単に栄養に使われるだけではなく、腸内エコシステムを制御するシグナル物質も含まれ、たとえば、制

御性 T細胞の転写因子の発現を促進したり大腸粘膜において炎症を抑制したり、免疫系、炎症系と

作用することがわかってきた。

マイクロバイオームを疾患環境因子として考えることで、人に常在する微生物叢、中で

も腸管微生物叢が健康状態に大きな影響を及ぼしているマイクロバイオームを疾患の環境

発症要因として考えることができる(図 11)。

図11. 疾患環境因子としてのマイクロバイオーム

(東京医科歯科大学/東北大学・田中博氏提供資料)

Page 17: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第一章 ビッグデータ、人工知能、予防・先制医療の基盤技術の動向

- 10 -

疾患の発症や進展を考察する上で、腸内エコシステムの細菌菌種の多様性やバランスが

崩れた「dysbiosys」が注目されている。マイクロバイオームの崩れにより腸疾患、全身性

疾患などが引き起こされることが明らかとなりつつあり、IBD 患者では増悪の原因となっ

たりする。自閉症や2型糖尿病などが「dysbiosys」により惹起されることも報告されてい

る。腸内エコシステムの多様性・恒常性維持が健康維持に重要で、その崩壊が疾病発症に

進展する(図 12)。

図 12.マイクロバイオームの崩れ

(東京医科歯科大学/東北大学・田中博氏提供資料)

疾患には遺伝素因と環境要因があるが、環境要因として腸内エコシステムを考える視

点が新しい治療法・薬剤を提供する可能性がある(図 13)。

図 13.環境要因として腸内エコシステムを考える

(東京医科歯科大学/東北大学・田中博氏提供資料)

Page 18: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第一章 ビッグデータ、人工知能、予防・先制医療の基盤技術の動向

- 11 -

マイクロバイオームをターゲットとした創薬については以下のアプローチ法が考えられ

る。

1) 特定の菌種による腸内細菌叢由来物質を標的とした創薬

2) 糞便移植・細菌カクテル投与等集合的入力によるマイクロバイオームの改善

3) Systems Metagenomics Approach:メタゲノム情報や、メタオミックス情報を元

にシステム制御(腸内エコシステムの超生物体ネットワークの制御)としての創薬

を目指す。

すでに国外では多くのバイオベンチャー企業が上記のマイクロバイオーム創薬をいろい

ろなアプローチで進めている。近年の世界的な研究の流れとして米国では、2008 年より

Human Microbiome Project が発足し、健常者の細菌叢解析や IBD 患者の糞便解析、長期

コホート研究などが継続中で、オバマ大統領の precision medicine initiative の 100 万人

コホートが開始されたが、この中にマイクロバイオーム関連のデータが収集項目となって

おり、勢力的に研究が進められている。

欧州においても米国同様健常者を含む細菌叢解析が進められているほか、フランスを中

心としたメタゲノム解析や細菌叢収集を含むバイオバンク構築の体制も固めつつある。

各国の網羅的メタゲノム計画もメタゲノム・マイクロバイオームの長期的変化を追跡する

ために Biobank の利用に関心を向けている。

我が国においては東京大学(現早稲田大学) 服部らが「日本ヒト常在細菌叢コンソー

シアム」を立ち上げ(2005 年)後、13 名の腸内細菌叢メタゲノム解析(66 万遺伝子)の

成果が発表された(2007 年)。また東北メディカル・メガバンクでも「歯垢を中心とした

口腔内細菌叢解析」が進められている。

6. 執筆担当者所感

今回の田中教授の講演からまず率直に感じたことは、長年蓄積されてきた疾患の病因に

かかわる基礎的データに加えて医療施設で絶えず蓄積されている患者の疾患レジストリー

のデータを、AI を駆使しながら難病対策など将来の新たな医療に有効活用していくことの

重要性である。特に今後の新薬の創出および臨床開発においては、実践的に作業を担当す

る製薬企業がただでさえ膨大な資源を高いリスクの下で投入している現況を打ち破り、一

企業だけでなく、産官学の連携のもとで、上記の既存のビッグデータに対して AI を駆使

し、情報を共有して統一された方向性や対策方針を打ち出すことが今後のベクトルになる

のではないかという印象を受けた。

新薬の開発を行う場合、多大な経費と時間を要する治験のステップにおいて、旧来より

エビデンスの高い試験デザインとして汎用されてきたランダム化二重盲検試験について、

近年個別化医療を考察する中で見直しの動きが国外で出始めており、Real world data を

反映させた集団の治験を実施する等、将来に向けた治験のためのプラットフォーム作りが

新たに検討されつつある模様である。我が国においては臨床試験、治験の在り方について

は今のところ進め方の根本の改変は無いようであるが、今後治験にかかわる研究者、行政、

製薬業界を含めて議論を深めながら、疾患レジストリーやバイオバンクを活用した臨床試

験へ段階的な移行について検討を進めるべきと思われる。

マイクロバイオームへの取り組みについては国内外含めて疾患治療を考察する上で、生

Page 19: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第一章 ビッグデータ、人工知能、予防・先制医療の基盤技術の動向

- 12 -

体におけるマイクロバイオームのシステムが崩壊したとき(dysbiosys)に、腸内エコシス

テムの細菌菌種の多様性やバランスが病態の発現にどのように関与するか、その過程をも

う少し詳細に検討していく必要があると思われる。将来マイクロバイオーム異常に伴う疾

患に奏功する画期的な新薬が創製されることを期待して、“マイクロバイオーム起因性の病

態に対する薬剤開発の在り方”といった基本的な方針を産官学挙げて構築すべき時期にき

ているのかも知れない。

【参考文献】

1) 平成 27 年度創薬基盤推進研究事業 創薬資源調査報告書「医療ビッグデータの活用

並びにバイオマーカー実用化の最新動向-創薬並びに個別化医療や予防医療への可能

性を探る」p3-12 公益財団法人ヒューマンサイエンス振興財団(2016)

Page 20: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第一章 ビッグデータ、人工知能、予防・先制医療の基盤技術の動向

- 13 -

〔2〕 コホート研究からの認知症の血液バイオマーカー発見と

先制医療に向けた新検査法の開発

ヒアリング先:

筑波大学医学医療系

内田 和彦 准教授

要約

茨城県利根町と筑波大学が協力して 2001 年から 2012 年にかけて 65 歳以上の地域住民

を対象にして行った利根町コホート研究において、新たな認知症の血液バイオマーカーを

発見し、これを基に軽度認知症(MCI)の簡便なスクリーニング法を開発した。この検査

法の精度は、筑波大学附属病院の臨床研究(横断研究)と宇治市の病院で行った前向きの

臨床研究で確認された。現在までに 1,500 以上の医療機関で採用され、9,000 件以上の検

査実績があり、認知症の先制医療、すなわち、プレクリニカルステージでの治療介入法構

築に向けた検査法として活用される可能性がある。

1. はじめに

ヒューマンサイエンス振興財団創薬資源調査班では、この 3 年間コホート研究、オミク

ス解析、臨床情報、ウエアラブルデバイスなどから得られるビッグデータを解析すること

で先制医療、個別化医療、あるいは創薬にいかに結びつけるかについて調査を行ってきた。

特に、先制医療においては、コホート研究からの成果が実際の医療に結びつくものは海外

も含めて、まだまだ少ないという印象である。その中での一つの成功例として、2001 年に

スタートした茨城県利根町でのコホート研究の成果を元に発見された血中バイオマーカー

を用いた軽度認知症(MCI)のスクリーニング法を確立されて、一般の医療機関向けに提

供できるまでに至っておられる、筑波大学の内田和彦准教授にその経過、成功の要因につ

いてお話を伺った。

2. アルツハイマー病のプレクリニカルステージ

2013 年 3 月に発表された厚生労働科学研究費補助金認知症対策総合研究事業(代表研

究者:朝田隆筑波大教授)の報告書1)によると、65 歳以上の高齢者の認知症の全国有病

率は推計 15%で、2012 年時点で推定 462 万人、認知症予備軍の軽度認知障害(MCI)が

約 400 万人であることが報告された。有病率の推定に当っては、医師による面接調査まで

の完遂率の高さを考慮し、コホート研究が行われている利根町、久山町を含む 8 地域の対

象者 7,825 名、参加者 5,386 名のデータをもとにメタ解析により算出されている。認知症

を発症すると、治療費だけでなく多くの場合介護が必要になるため、高齢化が進む日本で

は多大な社会保障費が認知症対策に投入されていくことになり、大きな社会問題となって

いる。

2011 年に National Institute on Aging-Alzheimer ’s Association 合同作業グループから

アルツハイマー病(AD)のプレクリニカルステージを規定する診断ガイドラインが発表さ

れた2)。このガイドラインでは発症する前の段階からの連続した疾患として AD をとらえ、

3 つの病期に分類している。それぞれ、症状は無いがさまざまなバイオマーカーが変化を

Page 21: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第一章 ビッグデータ、人工知能、予防・先制医療の基盤技術の動向

- 14 -

始める AD の発症前段階(プレクリニカルステージ、preclinical stages of AD)、AD に移

行する前段階である軽度認知障害(mild cognitive impairment due to AD; MCI/AD)、そ

して、臨床で診断される AD による認知症である(図1)。

疾患の進展をモニターするバイオマーカーとしては、脳脊髄液内のアミロイドβ(Aβ)

やタウ、リン酸化タウの量、MRI、PET などの画像診断が採用されている。これらのバイ

オマーカーの変化が始まってから AD を発症するまでは約 20 年の年月がかかる連続的な

疾患であるため、早期に MCI あるいは AD への移行の兆候を発見することができれば、

病状の進行を遅らせたり発症しないよう予防を施したりすることができるようになる。そ

れには、糖尿病における血糖値のように、発症する前から簡便に測定できるバイオマーカ

ーが AD にも望まれていた。

図 1. アルツハイマー病における先制医療の必要なステージ

(MCBI社ホームページより)

3. コホート研究から認知症バイオマーカーの発見、血液検査法確立まで

(1) 利根町コホート研究の概要

利根町コホート研究は健常から MCI や認知症までを継続的に調査する縦断研究である

3)。2001 年に当時筑波大学教授だった朝田隆教授(現東京医科歯科大)らが始め、当初の

研究目的は認知症の有病率調査と予防介入プログラムの導入であった。本研究では、筑波

大学精神神経科と茨城県利根町役場が協力し、地域住民を対象に MCI と認知症ならびに

うつ状態の疫学調査及び介入調査が行われた。

茨城県利根町在住の、2001 年 5 月 1 日時点で 65 歳以上の男女 2,730 人を対象集団とし

て開始され、2012 年まで追跡調査が行われた。途中 3 年ごとに 4 回の徹底調査が行われ、

認知機能の評価データと血液サンプルを蓄積した。認知機能検査としてはファイブ・コグ

という方法が使われた。記憶(手がかり再生)、注意(一判断)、言語(動物名想起)、視空

間認知(時計描画)、推論(WAIS-R の類推)の 5 つのサブテストからなる検査方法である。

介入法については、EPA、DHA などのサプリメントによる栄養介入、有酸素運動、睡

Page 22: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第一章 ビッグデータ、人工知能、予防・先制医療の基盤技術の動向

- 15 -

眠改善と短時間昼寝の 3 つが行われた。

この利根町コホート研究に内田准教授らが加わり、採血を行って血液中のタンパク質や

ペプチド、代謝物の量を調べ、AD の病状進行と関連のある血中バイオマーカーの網羅的

探索が行われた4)。

(2)認知症バイオマーカーの探索

利根町コホート研究では、同一参加者から採血した血液を用いて、時間経過を追跡する

ことができる。2001 年の時点で 65 歳以上かつ認知機能が正常な参加者 1,270 名をベース

ラインに置き、この参加者のうち 1,024 名が 2005 年に、584 名が 2008 年に追跡調査に参

加した。2005, 2008 年に採血したサンプルから血中タンパク質の測定が行われた。2012

年のフォローアップ研究において、2005 年から 2008 年の間に AD による MCI になった

と判定された患者のデータのみを選択し、AD 以外の認知症は除外された。ランダムに抽

出された Nondemented disease control (NDC)群との比較を行うことで、AD の進行によ

り血中濃度が変化するタンパク質の探索が行われた。

脳内のアミロイドβ(Aβ)ペプチドの排除や毒性防御に働くタンパク質の減少がMCI

やADの早期発見に有効であるとの仮説をたて、補体タンパク質C3及びC4, トランスサイ

レチン(TTR)、アポリポタンパク質A1(ApoA1)及びApoE, MIP-4(macrophage

inflammatory protein 4)などを主たる解析対象とした。その結果、補体 C3, ApoA1, TTR

が認知症の進行とともに減少していることが明らかになった。そこで、これらの血液マー

カーを MCI あるいはアルツハイマー病を見つける検査法として確立した(図 2)。

図2.バイオマーカーの発見と検査法開発の経緯

(医学系大学産学連携ネットワーク協議会新技術説明会資料6)より)

Page 23: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第一章 ビッグデータ、人工知能、予防・先制医療の基盤技術の動向

- 16 -

(3)3 つのタンパク質

バイオマーカー候補となった、3 つのタンパク質は脳内で Aβの排除や毒性防御に働く、

いわゆるシークエスタータンパク質であり、以下の機能を持つと言われている。

① 補体 C3

自然免疫の主役。ミクログリアの活性化に必要。ミクログリアによる脳内の異物

の排除を担っており、補体タンパク質がうまく機能しないと Aβが蓄積しやすく

なり、神経細胞の損傷につながる。

② アポリポプロテイン A1

脂質輸送の HDL の成分。アポ E, A1, J は Aβに結合して脳内から髄液、そして血

液へと排出する仕組みがある。

③ トランスサイレチン

プレアルブミンとも呼ばれるホモ4量体のタンパク質で、Aβと結合するタンパク

質として 1994 年に同定された。

(4)3 つのバイオマーカー候補の臨床研究による確認

こうして同定された AD の病状進行とともに血中濃度が変化する 3 つのタンパク質につ

いて、その有効性を確認するため筑波大学附属病院の患者を筑波コホートとして横断研究

が行われた。患者数は 441 で、AD、MCI、AD 以外の認知症などが含まれていたが、それ

らを AD と AD による MCI 及び NDC 群に分けて解析した。3 つのタンパク質により NDC

から MCI を区別して検出できる感度は 80%であった。

さらに、3 つのタンパク質による検査方法の一般性を確認するため、宇治市の病院と組

んで前向き研究(アッセイ開発、多施設臨床研究)が行われた。258 名の患者を対象とし

検査を行ったところ、本検査法で NDC と pre-MCI 間、及び NDC と MCI 間の識別が可

能であることが確認された(図 3)。

図3.3 つのタンパク質を用いた検査法による MCI と健常の識別

(医学系大学産学連携ネットワーク協議会新技術説明会資料6)より)

Page 24: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第一章 ビッグデータ、人工知能、予防・先制医療の基盤技術の動向

- 17 -

(5)MCI 検査法の確立

以上のようにして、3 つの血清タンパク質を組み合わせたマルチマーカーによる回帰分

析により、認知機能健常者と MCI を約 80%の精度で識別する MCI 検査法が確立された。

検査の流れは、医療機関において 7 ml の血液を採血し、株式会社 MCBI の保健科学グ

ループをはじめとする検査会社に提出すれば 2~3 週間で検査結果が郵送されてくるとい

うものである。保険適用外であり、検査費は検査を提供する医療機関が決めるが、平均し

て 2~3 万円の患者負担となる。検査結果については、直接被検者に伝えることはせず、

必ず医療機関の医師やスタッフを通じて検査結果を伝えている。また、その後の確定診断

や治療的介入についてもフォローアップを行っている。

2017 年 2 月現在 1,500 以上の医療機関で採用され、約 9,000 件の検査実績がある。3 つ

のタンパク質がどれだけ減っているかを数値化し統計学的にリスク判定がなされている。

結果は A 判定(健常)から D 判定(MCI のリスク高め)まで 4 段階でフィードバックさ

れ、D 判定の場合は 2 次検査の受診が患者に薦められる。

4. 認知症の予防

利根コホート研究では認知症予防の効果を見るため、3 つの介入方法で研究5)が行われ

た。1,023 名を対象に介入群と非介入群に分け、栄養、運動、睡眠の 3 つの介入方法が 2001

年から 3 年間にわたって施された。栄養介入として EPA、DHA、イチョウ葉エキス、リ

コペンからなるサプリメントを、運動介入として本研究のために開発された有酸素運動を、

睡眠介入として睡眠衛生指導と 30 分以内の短時間昼寝を行った。3 年間の介入の結果、

MCI 群で記憶に、認知症群で記憶、注意、遂行機能に改善が認められた。また、認知症発

症は、介入群でおよそ 30%少なかった。この結果は生活習慣への介入が認知症発症のリス

クを減少し得ることを示している。

科学的根拠のある予防法は有酸素運動である。動物実験では小脳の毛細血管の密度の上

昇、神経栄養遺伝因子の遺伝子発現の増加、海馬における神経細胞新生促進などが示され

ている。最大心拍数の 60-90%の強度の運動を1回あたり 20-60 分、週に 3-5 回行うと効

果があるといわれている3)。

MCI スクリーニングの検査値が、認知症予防のために実施された治療介入の効果を反映

するか否かについては、現在、多施設臨床研究において検討がなされている。

5. 今後の展望と課題

認知症は大凡 20 年かけて進行する病気であり、早期発見できれば治療も予防もできる

と考えられる。認知症にかかわる医師は、薬だけに頼るのではなく栄養学や運動科学にも

精通する必要がある。

MCI 検査については、今後、更に検査の精度を上げるとともに、早期発見と発症前の治

療的介入が認知機能の低下の進行を防ぎ、認知症の発症を予防することを長期的コホート

研究で示すことを計画している。

コホート研究の成果の活用に関しては、今回のように綿密に計画された臨床研究を、新

たに発見されたバイオマーカーの有効性の確認のために行うことが重要で、これを行わな

いと臨床応用へは進めない。コホート研究の計画・実施においても、成果の臨床応用・実

Page 25: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第一章 ビッグデータ、人工知能、予防・先制医療の基盤技術の動向

- 18 -

用化を念頭に置いて進めることが必要である。

6. 執筆担当者所感

コホート研究からビッグデータを得て、それを解析して医療・創薬に結びつけるという

試みの数少ない成功例の一つとして本研究を紹介したが、解析したデータはビッグデータ

といえるほど大きなものではないかもしれない。しかしながら、脳内 Aβの排除や毒性防

御に働くタンパク質といった明確な機能を担っていないタンパク質では、その濃度変化で

検査結果が出たとしても医師や患者の納得度は高くないと考えられる。バイオマーカーの

病態生理機能が説明できることも重視しながら AI 技術で精度の高い結果を出す判定法を

編み出す、という臨床での実用化を前提としたバランスの取れた検査法創出が重要である

と考える。

内田准教授らは、現在も 3 つのタンパク質以外に AD のプレクリニカルステージで検出

できるペプチドや代謝物の探索を行っている。この研究から新たな AD 関連物質が同定さ

れれば、先制医療のための新たな検査法の構築が可能となり、更には新薬創出研究の新し

い標的が見つかる可能性もある。今後の研究成果にも期待したい。

【参考文献】

1) 都市部における認知症有病率と認知症の生活機能障害への対応 2013年 3月. 厚生労

働科学研究費補助金認知症対策総合研究事業(代表研究者:朝田隆筑波大教授)報告

2) Sperling RA. et al. Toward defining the preclinical stages of Alzheimer’s disease:

Recommendations from the National Institute on Aging-Alzheimer’s Association

workgroups on diagnostic guidelines for Alzheimer’s disease. Alzheimers Dement

2011, 7: 280-292.

3) 朝田隆 自分ごととしての認知症 日本アイソトープ協会市民講座 2016 年 2 月.

説明資料 http://www.jrias.or.jp/seminar/seminar/pdf/HPdata_asada.pdf

4) Uchida K. et al. Amyloid-β sequester proteins as blood-based biomarkers of

cognitive decline. Alzheimers Dement 2015, 11: 270-280.

5) 水上勝義 軽度認知症外(MCI)症例にはどう対応すべきか? 精神神経 2009,

26-30.

6) 内田和彦 画期的な血液バイオマーカーによる認知症の早期発見と予防の取り組み

(科学技術振興機構 医学系大学産学連携ネットワーク協議会新技術説明会)

2016 年 1 月.説明資料

https://shingi.jst.go.jp/past_abst/abst/p/15/medU-net/medU-net04.pdf

Page 26: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 19 -

第ニ章

ビッグデータ、人工知能、マイクロバイオーム等の創薬

ならびに予防・先制医療への活用

第1節 臨床情報の創薬への利活用

はじめに

医療分野における ICT(Information and Communication Technology)の利活用につ

いては、2016 年 6 月の政府の日本再興戦略 2016 における AI や IoT の研究整備への言及

をはじめ、健康・医療戦略推進本部の医療分野研究開発推進計画見直し案、11 月の未来投

資会議での安倍首相の発言の中で、ICT 利活用の推進が述べられており、次世代医療 ICT

基盤協議会においても、利活用への施策などが答申されている。これらを踏まえ、2017

年 3 月には、「医療分野の研究開発に資するための匿名加工医療情報に関する法律案」が

閣議決定されており、臨床情報利活用の国主導による整備が開始されている。そのような

中、本調査班においても、医療情報の標準化および利活用についてヒアリングを実施した。

本節では、標準化ストレージで代表的な SS MIX2 を中心に、標準化の現状、電子化の

現状、今後の利活用システム等について、東京大・社会医学専攻・医療情報学分野の大江

和彦教授に、モバイルデータを活用した糖尿病患者における臨床研究における成果と課題

について、東京大学大学院医学系研究科・22 世紀医療センター・健康空間情報学講座の脇

嘉代講座長に、さらに、精神科領域において、画像処理技術や AI を用いた高度な診断を

目指したプロジェクト「PROMPT」について、慶應大医学部精神神経科の岸本泰士郎専任

講師にヒアリングを実施し、解説した。また、臨床情報の利活用において重要な課題であ

る個人情報保護に関して、個人情報保護法の改正並びに研究倫理指針の改正への動きにつ

いても概説した。

Page 27: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 20 -

第 1節関連ヒアリング先とヒアリング概要

ヒアリング先 概要

1

東京大・社会医学専攻

医療情報学分野

大江 和彦 教授

「医療情報やウエアラブル機器からのデータを先制(予

防)医療や創薬に活用する可能性と今後の課題」

医療機関で発生する多種多様なデータ(医療情報)や、

今後急増すると考えられるウエアラブル機器やモバイル

機器から収集される生活圏データ(ライフデータ)の医

療・創薬への活用が期待されている。医療情報やライフ

データの標準化と先制(予防)医療・創薬への活用、お

よび今後の課題もある。医療データの標準化ならびに利

活用の現状について解説。

2

東京大学

大学院医学系研究科

健康空間情報学講座

脇 嘉代 講座長

「モバイル環境における新しい医療-医療用アプリの臨

床応用への課題と展望-」

東京大学大学院医学系研究科健康空間情報学講座におい

て開発した糖尿病患者の自己管理支援のアプリケーショ

ンを用いて臨床試験を実施し、有用性の評価を行ったと

ころ、行動変容につながることがわかった。しかし、一

方で継続性に大きな課題があることもわかった。取り組

まれた研究内容の紹介ならびにモバイル機器を用いた臨

床研究の課題について解説。

3

慶應義塾大学

医学部精神神経科

岸本泰士郎 専任講師

「プロジェクト「PROMPT」の概要 -医療(解析セン

サー)機器や解析手法の特徴および人工知能の活用の実

際」

カメラやマイクを通して得られた患者の表情、瞬目、体

動、声などの情報と、精神科医による診断結果とを関連

付けて機械学習させ、精神科疾患の客観的な重症度尺度

を作成することが可能となるような新規医療機器を含む

診断システムの開発を最終目標としている。うつ病とそ

うでない人との見分けをトレーニングしており、かなり

精度の高い予測が可能になってきている。プロジェクト

の取り組みを中心に、今後の展望について解説。

Page 28: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 21 -

〔1〕 医療情報やウエアラブル機器からのデータを先制(予防)医療や創薬

に活用する可能性と今後の課題

ヒアリング先:東京大学大学院医学系研究科 医療情報学分野

大江 和彦 教授

要約

医療機関で発生する主な医療情報として、カルテ情報とレセプト情報の 2 つがある。

SS-MIX2 標準化ストレージは、規格が異なる各社の電子カルテ情報を標準化して格納する

標準化システムである。SS-MIX2 標準化ストレージの普及により、多目的臨床データ登録

システム(MCDRS)を利用した学会主導の臨床データベースへのデータ登録の省力化・

効率化や、医療情報データベースシステム基盤整備事業(MID-NET)等の実施が可能と

なっている。

また、近年様々なウエアラブル機器やモバイル機器から医療・健康関連の生活圏データ

(ライフデータ)が収集されている。東京大学ではスマートフォンのアプリケーション

「HearTily(ハーティリー)」や「GlucoNote(グルコノート)」を用いた臨床研究が実施

されている。今後急増すると考えられるライフデータについては、医療情報と連携できる

標準化インフラ(SS-MIX2 準拠パーソナルライフデータストレージ)構築が検討されてい

る。

医療における人工知能(AI)活用場面としては、患者からの臨床情報収集(問診、臨床

検査)、診断や治療計画の立案などが考えられ、将来は、マルチモーダル(複数の種類のデ

ータ)を組み合わせた Deep Learning による医療診断システムが医師の診断補助となるこ

となどが期待される。しかし、AI の開発には膨大な正解データ付きのビッグデータを必要

とする。

医療における AI を支えるのは「きちんとした構造化された医療データ」を研究者とシ

ステムが使える環境である。そのため、AI 技術が使える「質と構造化を持つ」医療データ

を生成する技術を開発し、生成されたデータの利用環境を作ることが必要である。

1. はじめに

医療機関で発生する多種多様なデータ(医療情報)や、今後急増すると考えられるウエ

アラブル機器やモバイル機器から収集される生活圏データ(ライフデータ)の医療・創薬

への活用が期待されている。大江教授は、内閣官房健康・医療戦略推進本部の次世代医療

ICT 基盤協議会の構成委員、厚生労働省保健医療情報標準化協議会の座長や一般財団法人

日本医療情報学会の学会長として医療情報の標準化と利活用を推進されている。また、国

立研究開発法人日本医療研究開発機構(AMED)平成 27 年度臨床研究等 ICT 基盤構築研

究事業の「医用知能情報システム基盤の研究開発」や、東京大学 COI(Center Of Innovation)

拠点における「パーソナルゲノム情報・臨床情報統合データベース構築」等の研究にも取

り組まれている。

そのため、今回、大江教授に医療情報やライフデータの標準化と先制(予防)医療・創

薬への活用、および今後の課題についてお話を伺った。

Page 29: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 22 -

2. 医療情報の標準化と利用

(1)医療情報の電子化

医療機関で発生する主な医療情報として、カルテ情報とレセプト情報の 2 つがある(図

1)。カルテ情報は、電子カルテに代表される診療記録系データであり、臨床経過、検査結

果の生データ、患者の主観的情報や医療者の客観的情報などの多種多様な情報が含まれる。

しかし、2014 年 10 月時点における電子カルテ導入率は一般病院 34.2%、一般診療所 35%

であり、まだまだ電子化は遅れている。

一方、レセプト情報は、診療報酬請求に係る医事会計系データであり、電子化率は 100%

に近い(平成 28 年 2 月診療分では電子レセプト割合 98%)。レセプト情報は厚生労働省

が所轄するデータベース「レセプト情報・特定健診等情報データベース(NDB:National

Database)」に 2009 年から集積され、ビッグデータとなっている。この情報の第三者利

用を促進するため、現在、厚生労働省の「レセプト情報等の提供に関する有識者会議」に

おいてオンサイトリサーチセンター(東京大学及び京都大学に設置)の試行的利用を開始

している。

図1.電子カルテシステム(and オーダシステム)

(東京大学・大江和彦氏提供資料)

(2)電子カルテ情報の標準化:SS-MIX2 標準化ストレージ

電子カルテ情報は、システムの製作会社ごとに規格が異なり、同じ会社の電子カルテで

もバージョンによってデータベースの内部構造が少しずつ違う。そのため、電子カルテ情

報を多くの医療機関から集めてビッグデータを構築するには、データ形式や識別コードを

共通の標準的なデータに変換する必要がある。

SS-MIX2 標準化ストレージは、規格が異なる各社電子カルテ情報を標準化して格納する

標準化システムである(図 2)。SS-MIX2 標準化ストレージは、電子カルテ情報を国際標

準 ISO27931 に準拠したデータ形式で、厚生労働省標準のデータ項目識別コードを採用し

たデータに変換出力し、電子ファイルシステムとして格納するデータ保管庫のようなもの

である。

Page 30: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 23 -

現在、SS-MIX 普及推進コンソーシアムが SS-MIX2 標準化ストレージの普及活動を行

い、一般社団法人日本医療情報学会が SS-MIX2 標準化ストレージの仕様書・ガイドライ

ンを無料で公開している。SS-MIX2 標準化ストレージは厚生労働省標準規格に認定されて

いるため、国立病院等でも採用が進められている。SS-MIX2 標準化ストレージは、2016

年 3 月時点で約 630 の病院に普及し、電子カルテ導入施設の約 35%に採用されている。

図2.SS-MIX2 標準化ストレージ

(東京大学・大江和彦氏提供資料)

なお、SS-MIX2 標準化ストレージは、電子カルテ上の病名、処方、検査結果などのデー

タは格納できるが、内視鏡検査結果、病理検査結果、透析記録、心電図、手術記録など、

格納できないデータが数多く存在することが課題であった。これらのデータに対応するた

め、近年、Version1.2d として SS-MIX2 拡張ストレージの詳細な仕様が定義されたので、

多くの種類のデータが標準化できるようになった。

(3)SS-MIX2 標準化ストレージを利用した医療情報の 2 次利用

①多目的臨床データ登録システム(MCDRS;Multi-purpose Clinical Data Repository

System;マックドクターズ)

MCDRS は、Web ベースの臨床症例データ登録システム用のソフトウェアである。施設

内に SS-MIX2 標準化ストレージが設置されていれば、Web 上のデータ登録欄に必要なデ

ータを自動入力できる機能があるため、入力者は手で入力することなくデータの確認のみ

で症例登録できる(図 4)。

近年、様々な学会主導の臨床データベース構築が進められており、厚生労働省も臨床効

果データベース整備事業で選定した団体のデータベース構築に一定の補助を行って支援し

ている。MCDRS は、J-DREAMS(診療録直結型全国糖尿病データベース事業:日本糖尿

病学会)、J-CKD-DB(慢性腎臓病症例 DB 事業:日本腎臓病学会)、循環器疾患レジスト

リ拠点(日本循環器学会)、救急医療症例登録データベース(日本救急医学会)、日本脳卒

Page 31: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 24 -

中データバンク(国立循環器病研究センター)等の臨床データベースで既に採用され、デ

ータ登録の省力化と効率化に貢献している(図 3)。

図3.多目的臨床データ登録システム MCDRS

(東京大学・大江和彦氏提供資料)

②医療情報データベースシステム基盤整備事業(MID-NET)

MID-NET は、厚生労働省と独立行政法人 医薬品医療機器総合機構(PMDA)が実施

している事業で、協力医療機関(全国 10 拠点、23 病院)が保有している電子的な医療情

報を網羅的に収集した医療情報データベースである。各病院のカルテ情報は、SS-MIX2

標準化ストレージ化システムで標準化後、匿名化されて統合データソースに収集され、一

定のプロトコールで抽出して解析されることになっている(図 4)。

本事業は、早期の副作用の検知等への利用も期待されており、現在、各大学で試験運用

やデータのバリデーションの実施段階であるが、2018 年度に本格運用予定となっている。

図4.医療情報データベースシステム基盤整備事業(MID-NET)

(東京大学・大江和彦氏提供資料)

Page 32: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 25 -

③災害対策バックアップ(国立大学病院事業)

すべての国立大学病院が SS-MIX2 標準化データの情報を保有しているため、東日本と

西日本のデータセンターにこれをコピーすることで、全国立大学病院のカルテ情報の主要

部分がリアルタイムでバックアップ保管されている。そのため、自然災害等で国立大学病

院が一時的に機能しなくなった場合でも、インターネット経由でデータセンターにアクセ

スすれば検査結果や服薬情報等のカルテ情報を見ることができる体制となっている。

3.生活圏データ(ライフデータ)と連携する電子カルテ

(1)ライフデータ

近年、様々なウエアラブル機器やモバイル機器からライフデータとして生活圏の医療・

健康関連データを収集することが可能となっている。例えば、東レと日本電信電話株式会

社が開発した機能素材「hitoe」は、着衣すれば自動的に長時間心電図モニタリングができ

る。

東京大学医学部附属病院の健康空間情報学社会連携講座では、脈の揺らぎを管理・記録

するスマートフォンのアプリケーション(スマホアプリ)「HearTily(ハーティリー)」の

開発・臨床研究や、2 型糖尿病のコントロールに影響する生活習慣や血糖値などの測定結

果の記録をサポートするスマホアプリ「GlucoNote(グルコノート)」の開発・臨床研究を

実施している。また、患者の服薬を支援するために、在宅患者(特に要介護患者)の薬箱

の開閉情報を服薬情報としてスマートフォン経由で集める服薬支援システムの開発も行な

ってきた(図 5)。

図5.服薬支援システムの開発

(東京大学・大江和彦氏提供資料)

(2)ライフデータと医療データとの連携

今後、様々なライフデータが急増すると考えられる。病院や家庭でこれらの情報を活用

Page 33: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 26 -

するには、医療機関の医療情報とライフデータを必要時に連携することが求められる。現

在、様々なライフデータ用の標準化インフラ(SS-MIX2 準拠パーソナルライフデータスト

レージ)構築の研究に取り組んでいる。

電子カルテ情報のようにライフデータの標準化が進めば、大規模で継続的なビッグデー

タを構築することが可能となる。将来、個人毎の医療情報とライフデータからなるビッグ

データを統合、連携させ、個々人の健康・病状に介入し、最適の医療と健康管理ができる

ようにしたいと考えている(図 6)。

図6.ライフデータと医療データとの連携

(東京大学・大江和彦氏提供資料)

4.人工知能(AI)の活用

医療における AI 活用の場面としては、患者からの臨床情報収集(問診、臨床検査)、診

断や治療計画の立案などが考えられる。将来は、マルチモーダル(複数の種類のデータ)

を組み合わせた深層学習(Deep Learning)による医療診断システムを医師の診断補助に

することが期待される(図 7)。しかし、Deep Learning でレントゲン等の画像診断をする

には正しい診断や所見がついた膨大な画像データが必要であり、電子カルテ情報は記述が

少ないケースが多いため(例:「肺炎の疑い」のみの記載)、Deep Learning の学習データ

として用いることは難しい。また、診断には様々な医療情報(教科書、文献等)のデータ

ベースからの検索も必要となる。

2016 年、IBM の人工知能「ワトソン」が特殊な白血病患者の病名を約 10 分で見抜き、

適切な治療法の助言により患者の回復に貢献したと東京医科学研究所が発表したが、これ

は人工知能を用いた素晴しい成功例である。

Page 34: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 27 -

図7.ディープラーニングによるマルチモーダル医療診断システム

(東京大学・大江和彦氏提供資料)

興味深い AI 活用例としては、インターネット上の SNS やブログなどのビッグデータか

らの情報抽出がある。インフルエンザ・花粉症等に関する言葉の出現頻度の分析によって

どのような病気がどこで流行りつつあるのか可視化する試みや、患者の闘病 SNS をリア

ルタイムで自然言語処理することで極めて稀な事象(重要な副作用等)を抽出する試みが

行われている。

現在、大江教授の研究室では、国立研究開発法人日本医療研究開発機構(AMED)平成

27 年度臨床研究等 ICT 基盤構築研究事業の「医用知能情報システム基盤の研究開発」(図

8)や、東京大学 COI(Center Of Innovation)拠点での「パーソナルゲノム情報・臨床

情報統合データベース構築」に取り組んでいる。

図8.AMED 医用知能情報システム基盤の研究開発

(東京大学・大江和彦氏提供資料)

Page 35: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 28 -

5.課題

ビッグデータ解析技術や AI 技術の発展、電子カルテ情報に代表される臨床情報の電子

化・蓄積の進展や、モバイルデバイス普及による日常生活圏でのライフデータ収集の容易

化によって、臨床医学の実践結果の膨大なデータ(Real World Data)から新しい医学知

と臨床知を創出できる時代になった。しかし、研究者が大規模医療データを集中利用でき

る研究環境がほとんどないため、研究が行き詰っている。

AI の開発には、データ形式や質が標準化された膨大な正解付きのビッグデータを必要と

するが、現状では、臨床情報は医療現場に分散し、医療現場任せの記入形式なのでデータ

品質がばらつき、非構造化データが氾濫している。また、個人情報保護の制約によるデー

タ取得の難しさや、データ標準化が不十分であるといった課題もある。

医療 AI を支えるのは「きちんとした構造化された医療データ」を研究者とシステムが

使える環境である。そのため、AI 技術が使える「質と構造」を持つ医療データを生成する

技術を開発し、生成されたデータの利用環境を作ることが必要である。

6.執筆担当者所感

SS-MIX2 標準化ストレージの普及により、MCDRS を用いた学会主導の臨床データベー

スへのデータ登録の省力化・効率化や、医療情報データベースシステム基盤整備事業

(MID-NET)の実施が可能となっている。電子カルテ情報の質・データ量は医療現場に

依存するので、これらのデータベースを用いた研究で数多くの成果がでてくれば、医療現

場で電子カルテを記録するインセンティブとなり、良い循環が生まれるのではないかと感

じた。SS-MIX2 標準化ストレージで収録できないデータは拡張ストレージでの対応が進め

られているとのことなので、今後、さらに医療カルテ情報の質・量の充実と標準化が進む

ことを期待したい。

また、急増している様々なライフデータについても、医療カルテ情報と同様に、医療デ

ータとの連携を視野に入れたデータ標準化やデータの質が重要になると考えられる。生活

圏の様々なライフデータのための標準化インフラ(SS-MIX2 準拠パーソナルライフデータ

ストレージ)の研究が既に進められているが、早期の実現化が望まれる。データの質とい

う観点では、将来、ウエアラブル機器等については一定の基準を満たした機器を認定する

ような制度が必要になるかもしれない。

【参考文献】

1) 実験医学 Vol.34, No.5(増刊)148-154, 2016

2) 日本循環器病予防学会誌 Vol.50, No.3, 163-169, 2015

3) 情報管理 Vol.59, No.5, 277-283, 2016

Page 36: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 29 -

〔2〕 モバイル環境における新しい医療

-医療用アプリの臨床応用への課題と展望-

ヒアリング先:

東京大学大学院医学系研究科

社会連携講座 健康空間情報学講座

脇 嘉代 講座長

要約

情報通信技術(ICT)は新たな医療として受け入れられつつある。アメリカ食品医薬品

局(FDA)は ICT システムを医療機器として認定しており、糖尿病領域では Mobile

Prescription Therapy(MPT)というモバイル端末のアプリケーションを使った治療方法

が承認され、注目されている。日本においても、ソフトウェア単体での流通を可能にし、

「医療機器プログラム」として規制対象とする法律が施行され、承認申請に向けた取り組

みがなされている。

東京大学大学院医学系研究科健康空間情報学講座においても ICT 医療への取組みがな

されている。糖尿病患者に血圧、体重、歩数、血糖値等の複数項目を自宅で測定してもら

い、測定内容に対して糖尿病学会のガイドラインに基づいた判定結果を返し、生活習慣指

導を行い、自己管理を支援することを ICT を用いて実施しており、ランダム化比較試験に

よりその効果が検証された。糖尿病歴 5 年以上の患者を 54 名登録し、3 ヶ月間 DialBetics

というシステムを使う群と使わない群の 2 群(各 27 名)に分けてフォローした。その結

果、システムを使った群では、HbA1c 及び血糖値が有意に低下することが示された。HbA1c

が低下した患者の食事内容については、食物繊維の摂取量が増え、炭水化物の摂取量もタ

ンパク質と脂肪との摂取比率において減少していることが明らかとなった。さらにシステ

ム使用終了後も、生活習慣の改善効果は継続し、行動変容に繋がることが示唆された。

医療情報管理アプリの開発キットである ResearchKit(モバイルを使って患者の情報を

収集できる)は新たな研究手法として広がりつつある。本キットは、従来の臨床研究とは

異なり、データの取得頻度を上げることができ、低コストで研究への参加者を集められ、

実生活の中で測定機器とアプリを使うため生活習慣と生活環境と疾病の発症・進展の関係

性を検証できる可能性があり、参加者に随時フィードバックを実施できるので研究参加へ

のモチベーションを高めやすいといったメリットがある。一方で、アプリを用いた臨床研

究には特有の課題がある。その中で最も大きなものは継続性である。多くの臨床研究で、

最初の登録時点から 30 週で、試験継続者はほぼ 0 になってしまうという問題点が認めら

れている。

国際的にも新たな医療手段として ICT は受け入れられつつあるものの、まだその有用性

は確立されておらず、今後、医療として認知されるにはエビデンスを積むことが重要であ

る。また ICT 医療の利用は患者の行動変容に繋がることが期待でき、健康・未病から医療

まで一貫性のある自己管理支援を提供できるメリットもあり、今後そのような医療価値の

提供が求められる。

Page 37: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 30 -

1. はじめに

健康空間情報学講座のホームページによると、同講座は、スマートフォン(スマホ)や

無線LAN端末というモバイル情報機器及び情報ネットワークから構成される情報環境(空

間)を医療に実利用することを目指し研究を進めている。これらの情報機器及び情報ネッ

トワークにより、仮想的に統合される”健康情報空間”は、医療施設での限られた診療時

間という時間的空間的な制限を越える新たな診療機会をもたらすものであると記されてい

る1)。

糖尿病や心疾患などの生活習慣病においては、患者自らが日常生活の中で、いくつかの

医療・検査情報を連続的に取得、食事や運動を含む毎日の生活習慣を記録し、スマホを介

して健康情報空間に容易にアップロードすることができる。医療者はそれらの情報を参照

することにより、よりよい医療を施行することができると考えられる。

上記講座は、糖尿病患者の生活習慣管理のために、東大工学部の協力を得て検査情報及

び生活習慣情報を記録しアップロードするスマホアプリを開発した。そのアプリ利用の医

療的メリット及び限界を臨床研究により明らかにしている。

HS 財団創薬資源調査班では、一昨年よりスマホなどのモバイル情報機器が医療に、そ

して創薬研究にもたらす影響について調査を進めてきた。しかし、これまでの国内調査に

おいては、モバイル情報機器・アプリが実際に医療目的に利用される例を見出し得なかっ

た。

そのような経過の中、上記講座の臨床研究がモバイル情報機器の医療応用の先行例と認

められたため、調査班は研究の概要を脇講座長からお聴きすることとした。本稿において

は、ご講演内容の概要と、講演後の班員との討論内容の抜粋を記す。

2. ICT 医療の現状

(1) 米国における ICT 医療の実態

ICT は医療の領域においても、急成長で利用が進んでいる。米国での調査2)によると、

9 割を超える一般成人は、24 時間いつでも手の届く範囲に ICT 機器のひとつであるスマホ

を置いている。そして、半数を超えるスマホ利用者が、健康関連の情報(処方薬、治療法、

健康保険など)をスマホの情報サイトから取得している。このように、患者自らが積極的

に情報収集する時代が到来しつつある。

一方、医療従事者にとっても ICT は重要な情報源となり、約 8 割の医師がスマホ及び医

療用アプリを利用しているという。米国においては、アプリ作成・利用の法整備が進んで

おり、HIPAA(United States Health Insurance Portability and Accountability Act of

1966)により、アプリの患者情報の秘密が確保され、医療機関や医療従事者に受け入れら

れやすい環境が整った。他方、NCCE(National Cybersecurity Center of Excellence)は、

医療機関の情報セキュリティを支援している。多くの医師は、診療ガイドラインや医療エ

ビデンスをスマホから得ており、スマホの情報収集機能は診療に欠かせない時代になって

きた。

他方、ICT は重要な診療手段にもなりつつあり、医療用アプリも続々と登場してきてい

る。2015 年の HIMSS Mobile Technology Survey3)によると、調査回答者の 90%が患者

の管理にモバイル機器を使っており、36%が患者と連携できるアプリは有用であると回答

Page 38: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 31 -

している。米国の他の調査でも、回答者の 93%が医療アプリは患者の健康を増進するもの

と感じており、40%が医療 ICT によって受診回数を軽減できると考え、93%が救急医療

で迅速に情報を共有できることが有用であると回答している。このように、米国では、ICT

医療が診療に使用され始めている。

アプリの開発・ダウンロード数は著増しており、世界では 61%の人々がモバイルヘルス

(mHealth)と呼ばれるモバイル端末用の医療・ヘルスケア用アプリをダウンロードして

おり、市場として急成長している(mHealth アプリでは、85%がヘルスケアアプリ、15%

が医療アプリ)。すでにアプリの商業化モデルが多く成立していることから、mHealth は

医療・ヘルスケア産業からみても魅力のある市場分野である。アジア太平洋圏での市場成

長率は 35%と高く、今後が期待されている。

(2) 米国における ICT 医療の規制

米国 FDA は、ICT システムを医療機器として規制する方向にある。これまでのアプリ

は医療機器と組み合わせて医療機器という認定をされていたが、最近は医療用アプリを単

体で医療機器として認める方向にある。

糖尿病の管理にあたり、FDA に医療機器として承認されたアプリ、Mobile Prescription

Therapy(MPT)が新しい管理・治療方法として注目されている。すでに、米国糖尿病学

会(American Diabetes Association)は、MPT をインスリン及びその他の注射剤並びに

経口血糖降下剤と同列の治療法と位置づけている4)。医療機器として扱われるためには、

臨床試験で安全性と有効性が確認される必要がある。医療用アプリは、医療従事者と同様

に患者に対し治療法を提供するツールと定義されている。

一例として、WellDoc 社の BlueStar® 5)は、米国初の MPT であり、成人の 2 型糖尿病

患者向けのアプリである。患者がスマホアプリをインストールするときには、医師の処方

箋が必要である。本アプリは、自動応答システムにより治療計画に従って何をすべきかを

患者に指示し、治療目標を達成できるよう自己管理を支援するものである。一方、医師に

対しては治療の進捗状況を自動的に報告する仕組みである。ただし、このアプリは、臨床

所見が比較的安定した状態にある糖尿病患者向けの専用アプリであり、緊急時には非対応

であることが使用の免責事項とされている。

(3) 国内における ICT 医療の実態

総務省の「平成 26 年通信利用動向調査」6)によると、平成 26 年にはインターネットの

利用者は推計 1 億人(6 歳以上)を超え、国民の 8 割を超える普及率である。端末別の利

用状況では、自宅のパソコンが 53%、スマホが第 2 位で 47%と、スマホにより気軽にイ

ンターネットを利用し、いろいろな情報を収集する時代となっている。一方で、インター

ネットの利用率には世代格差・所得格差があり、60 歳代を超えると利用率は低下する。さ

らに、世帯年収によっても利用状況は異なってくる。

厚生労働省(厚労省)及び総務省は、健康・医療・介護分野における ICT 化を推進して

いる。厚労省は、「ICT の活用は、健康寿命の延伸、医療・介護サービスの質の向上と効

率化、医療技術の発展や効果的な政策 推進などを実現する上で大きな可能性を持つツール

の一つであり、我が国の社会保障制度を持続可能なものとしていくためにも、ICT を、自

Page 39: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 32 -

己目的化することなく効率的に活用する取組みを、今後とも推進していく。」と言及してい

る7)。

総務省・厚労省は、「PHR(Personal Health Record)プラットフォームを含めた効率

的で質の高い医療・介護情報連携ネットワークの在り方や健康・医療・介護分野における

データ活用のあり方などについて検討する。」としている8)。

日本糖尿病学会、日本高血圧学会、日本動脈硬化学会、日本腎臓病学会、日本臨床検査

医学会および日本医療情報学会は、糖尿病/高血圧症/脂質異常症/慢性腎臓病の「ミニマム

項目セット」、「自己管理項目セット」を策定し、どこの病院に行っても診療上のミニマム

のデータを見せることができるようデータの電子化標準化の方向性を提示した9)。

一方、医療用アプリについては、2014 年 11 月 25 日に施行された「医薬品、医療機器

等の品質、有効性及び安全性の確保に関する法律」および同年 11 月 14 日付けの「プログ

ラムの医療機器への該当性に関する基本的な考え方(薬食監麻発 1114 第 5 号)」10)にお

いて、診断等に用いる単体プログラムについては医療機器として製造販売の承認・認証等

の対象とすることとされた。従来はソフトウェア部分のみでは薬事法の規制対象とはなら

ず、ハードウェア部分に組み込んだ場合にのみ規制対象となっていた。現状においては、

薬事法上で承認されたアプリはないが、承認申請に向けた取り組みは国内企業でも進めら

れているようである。

3.東大・健康空間情報学講座における ICT医療への取り組み

(1)講座の目標

健康空間情報学講座は、ICT 医療の社会実装までを視野に入れ、時間的・空間的制約を

取り除いた、将来の診療のあり方の変革を目指している。

具体的には、以下の診療支援モデルにより自己管理の支援を行うことを想定している。

① 患者自らが、在宅で各種の検査を実施する。

② 検査結果を運動習慣及び食事内容などとともにスマホを介して医療施設に送付する。

③ 医療施設においては、それらのデータ及び過去の診療データを統合的に判断し、患者

に生活習慣・食事内容の改善点をスマホにフィードバックする。

(2)DialBetics(3D)を用いたランダム化比較試験

① DialBetics(3D)の概要

このシステムは、2 型糖尿病患者を対象とした ICT 自己管理支援システムであり、東大

工学部の協力のもとに開発された(図 1)。システムの概要を紹介するビデオが YouTube

に公開されている:

https://www.youtube.com/watch?v=dMa9VUdVJiM&feature=youtu.be

Page 40: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 33 -

図1. DialBetics(3D)の概要

(東京大学・ 脇嘉代氏提供資料)

患者は在宅で朝と晩に血圧、体重、歩数及び血糖値を自ら測定する。スマホと検査機

器は Bluetooth を介して連携しており、検査結果は自動的にアプリに保存・登録される。

歩数以外の自動登録できない運動と食事内容については、テキストか音声で入力する。

食事内容は画像として登録することも可能である。

登録された検査データについては、日本糖尿病学会糖尿病診療ガイド 2008-2009(日本

糖尿病学会編集)に基づき自動的に判定され、その結果が患者のスマホにフィードバッ

クされる。食事内容については、三大栄養素や食物繊維量のバランス及びそれらと運動

量(消費カロリー)とのバランスが判定されフィードバックされる。患者にとって、こ

れらのフィードバック内容は、自ら生活習慣・食事内容を改善するよいモチベーション

となる。ここが重要なところである。

他方、高リスクのデータ(血糖値>400mg/dL、<40 mg/dL、収縮期血圧>220mmHg

等)が登録された場合には、医師に連絡され、医師の監督の下に医療従事者が患者のス

マホに直接連絡する個別対応の仕組みをとっている。

② ランダム化比較試験の方法

DialBetics を用いた臨床研究では、2 型糖尿病患者を対象としてランダム化比較試験が

実施された(図 2)。試験への参加資格は、5 年以上の糖尿病歴があること、インスリン治

療は受けていないこと、そして合併症が軽度であり運動療法が実施できることである。

Page 41: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 34 -

図2. DialBetics の評価・ランダム化比較試験

(東京大学・ 脇嘉代氏提供資料)

参加意思表明のあった 66 名のうち、2 週間のフォローアップ期間中に検査機器の操作に

習熟した患者 54 名が試験に参加した。患者 54 名は DialBetics 使用群(測定群)及び非

使用群(非測定群)の 2 群、各 27 名に、HbA1c 値及び年齢・性別が均等になるように割

り付けられた。フォローアップ期間は 3 ヶ月間である。

③ ランダム化比較試験の結果

フォローアップ 3 か月後の各種検査値及び投薬量の変化を図 3 に示した。

図3.ランダム化比較試験の結果

(東京大学・ 脇嘉代氏提供資料)

Page 42: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 35 -

測定群では、開始時と比較すると HbA1c が 0.4%、血糖値が 5.5mg/dL、それぞれ有意

に低下した。また、BMI は低下傾向が見られた。一方、非測定群においてはこれらのパラ

メーターの低下は認められなかった。さらに、測定群の中で、HbA1c が改善した患者群と

改善しなかった患者群とでベースラインの違いが比較された。改善した患者群では、元々、

HbA1c 値は 7.3%と高く、改善しなかった患者群では 6.4%と低いことを見出した。この

ことは、学会の提示する治療目標である 7%未満をすでに達成している患者には、

DialBetics システムを使用してもそれほどのメリットはないと言う結果であった。

測定群 27 名のうち、食事画像を登録した 22 名を改善群(15 名)と非改善群(7 名)に

分けた 2 群間で、食事内容の変化が検討された(図 4)。

図4. 食事内容の変化

(東京大学・ 脇嘉代氏提供資料)

改善群では、期間中に食物繊維の摂取量が有意に増えた。これは、システムによる食習

慣指導のフィードバックが奏効したものと考えられた。

血糖値をコントロールするために、炭水化物(糖質)制限をする患者が増えており、そ

の影響が炭水化物比率にも反映されている。ICT を用い、患者の食を含む実生活にかかわ

る情報を登録してもらうと、従来の臨床研究に比べて情報量が多いことから食生活の改善

が HbA1c の改善をもたらしたこと等、細かい検証が可能である。

④ アプリ使用の継続性

アプリを用いた臨床研究では、患者側の検査実施やデータ登録の継続性が問題となるた

め、DialBetics の評価においても継続性に関する検討が加えられた。

本試験は、1 日 2 回(起床時及び眠前)、3 ヵ月間、検査を実施するプロトコールである。

起床時の測定については、最初の 2 週間は 9 割近い実施率であったが、後半の 2 週間につ

いては約 7 割に低下した。眠前の検査については、最初の 2 週間が約 8 割と起床時より低

Page 43: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 36 -

い傾向であった。1 日 2 回の自己検査は患者にとって負担が大きいものと思われ、後半は

血糖値及び血圧の測定率は約 5 割へと低下した。この種の研究においては、継続性の確保

が課題となる。

一方、アプリ使用システムのメリットは、患者の行動変容の動機付けができることであ

る。試験後のフォローアップで分かったことは、DialBetics 使用群は試験後に通常診療と

なったが、改善した HbA1c 値(6.7%)は 3 ヶ月後も引き続き 6.8%と維持されていた。

一旦行動変容が起きると、アプリシステムの使用を止めても生活習慣の改善は維持され、

その効果はある程度継続することが明らかにされた。糖尿病治療薬による治療効果と違っ

て、行動変容による治療効果は、継続性が期待できることが示唆された。

⑤ DialBetics 試験参加患者への聴きとり調査

本試験を完了した患者 34 名(脱落例を除く)に対面インタビュー形式でアンケート調

査が実施された。システムに関する利便性や有用性について、実際に患者がどう感じたの

かが仔細に聴き取られた。

利便性については、問題なく使用できたという意見が多かった。しかし、スマホアプリ

に通信トラブルが起こった場合、24 時間以内に解決されていないこともあったが、これは

本アプリが研究用に開発されたものであることに起因しており、商用化(社会実装化)さ

れた場合にはこういった問題はクリアされると考えられる。

自己管理上の有用性については、「測定し生活習慣を確認することで安心感はありました

か」の問いに対し 97%の人が「はい」と肯定的に答えた。「このスタディに参加したこと

は生活習慣の改善と糖尿病の自己管理に役立ちましたか」についても 94%の人が「はい」

と答えており、ICT システムを使うと従来の糖尿病診療にはないプラスアルファのメリッ

トがあることを示す結果であった。また 94%の人が「取られた時間だけの価値があった」

と回答しており、患者にとって価値があれば利用されるということが分かった。

「何が自己管理に良かったのか」の問いに対しては、「実際に自分で測定をして、その結

果を見て、それに対してフィードバックが返ってきて、それを確認するというのが非常に

重要である」との回答が多かった。実生活の中で検査機器とアプリを使い、結果に対して

医療者からフィードバックを受けると、より具体的に自分の生活上の問題点も分かり、健

康に対する意識が高まるものと考えられた。

「ヘルスケア・メディカルアプリを誰に勧められたら使うか?」について調査したとこ

ろ、医療従事者に勧められれば利用する意向が高いということが分かった。このことは、

システムの継続的使用、ひいては疾患の自己管理については、医療者からの指示・処方箋

という医療的「強制力」「支援」が必要ということを示唆する。ひるがえって考えれば、職

場にあっては産業医や健保組合からの指導、地域社会にあっては行政や検診施設の診断医

の助言がそのような「強制力」「支援」になるのかもしれない。

4.ResearchKit を用いた臨床研究

(1) ResearchKit を用いた臨床研究の概要

米国 Apple 社は、臨床研究へのスマホ(iPhone)の利用を促進するため、ResearchKit

(http://www.apple.com/jp/researchkit/)という医療情報収集アプリの開発キットを提供

Page 44: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 37 -

している。そのキットを使うと、アプリを比較的簡単に作り、公開することができる。2015

年から、いくつかの医療施設がアプリを開発・公開し、2015 年 3 月以降、被験者を募り、

電子的承認(IC)のもとに臨床研究を行っている。米国において、喘息、乳がん、心血管

疾患、2 型糖尿病、パーキンソン病の患者を対象とした研究アプリが開発され、多くの施

設で倫理委員会の承認を得てアプリを用いた臨床研究が実施されている(図 5)。いずれの

臨床研究においても、数千から数万人の登録者を集めている。登録者はアプリを使用して、

その日の体調、治療状況、現状の症状等を登録し、それに対して生活習慣改善のフィード

バックが返ってくるということがなされている。我が国でもすでにいくつかの臨床研究が

開始されている。

図5. ResearchKit を用いた臨床研究

(東京大学・ 脇嘉代氏提供資料)

(2)ResearchKit を用いた臨床研究のメリットと課題

従来の臨床研究では、研究への参加者が限定されること、患者の主観的データが取得さ

れること、データの取得頻度に限界があり高くできないこと、さらに情報提供が一方通行

であり患者が結果を容易に知ることができないことなどの限界があった。一方で、

ResearchKit を用いた臨床研究には以下のメリットがあげられる。

研究参加への地理的障壁が無い(スマホを持っていれば何処からでも参加可能)

スマホからデータを収集することにより健康的な行動様式と生活習慣の関連性が

検討可能(毎日リアルタイムで参加者と連携することによって生活習慣改善への

Page 45: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 38 -

良い動機付けになる)

従来の臨床研究と違って頻繁にデータ収集が可能(参加者の負担を軽減しつつ実

世界のデータを継続して集められる)

膨大なデータの解析には機械学習など新たな手法が必要

各種センサーとの連携による参加者の状態を客観的に評価可能

参加者が随時フィードバックを受けることでより好ましい結果が得られる

一方で、ResearchKit を用いた臨床研究には以下の課題がある。

選択バイアス(スマホを持っていなければ参加不可能)

参加者の身元は確認不可能(自己申告を信じるしかない)

スタディデザインの限界(データは自己申告でありブラインド化されていない)

継続性の維持(参加者は直ぐに興味を失う可能性が高い)

個人情報の管理(研究に利用されるデータは匿名化されている)

この中で最も大きな課題は継続性である。

先に述べた米国での臨床研究及び健康空間情報学講座と NTT ドコモが新たに開発したアプ

リである GlucoNote を用いた臨床研究においても同様であるが、被験者の参加状況を調査

すると、登録後 30 週間という短期間内に興味を失い、ほぼ全員が脱落している。Dorsey

らは、先に述べた 5 つの慢性疾患を対象にした臨床研究において、何れの研究においても、

登録開始時点から 10 週には登録者数の割合は 20%を切り、30 週には登録者はほぼ 0 にな

ってしまうという問題点を報告している11)。医療者と全く対面のない中でアプリ利用を

継続することの難しさを認識する結果であった。

スマホアプリを用い自由参加方式で被験者を募る臨床研究においては、多数の被験者を

リクルートすることは容易であるかのように見える。さらにそこでは、大量の被験者デー

タを取得でき、医療ビッグデータとして解析も可能になるのかもしれない。しかし、それ

はここに述べた継続性が確保されて初めて可能になることである。

5. 今後の展望と課題

(1) ResearchKit を用いた臨床研究の将来性

ResearchKit を用いた臨床研究の最大の強みは、参加者に随時フィードバックを実施で

きるので研究参加へのモチベーションを高めやすい点であり、以下の点が期待できる。

地理的障壁が無いので研究参加への積極性を高められる。

慢性疾患の自然経過を追跡できる。

アプリの使い回しが部分的に可能で新規に研究を開始しやすい。

各種センサーと組み合わせることにより収集できるデータの種類を最適化できる。

健康に向けた行動変容に繋がる生活様式の解明が期待できる。

したがって、将来的には、本キットを用いた臨床研究により、生活習慣、生活環境と疾

病の関連性を検証できる可能性がある。また、公衆衛生学的アプローチが可能となり、例

えばインフルエンザが流行している地域で警告を出すようなことも可能になるかもしれな

い。

Page 46: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 39 -

アプリ利用の継続性については、現在、健康空間情報学講座において、医療者の対面を

アドオンすることで GlucoNote の利用継続率を高める臨床試験を計画しており、その研究

成果が待たれる(https://www.nicho.co.jp/corporate/info/16184/)。

(2) ICT 医療の今後の課題

モバイル機器の普及率に世代格差や所得格差があるため、一般的な医療プラットフォー

ムとなるためにはなお時間が必要であるが、ICT 医療は新たな医療として受け入れられ、

有効な研究手法として広がりつつある。ICT 医療の医療価値を一般的に普及させるために

は、しっかりとした医学的なエビデンスを積んでいくことが何にも増して大切である。モ

バイル機器を用いた臨床研究の最大の課題は、継続性であり、ICT を用いた医療に効果が

あることをしっかりと示し、患者さんに認知、実感してもらうことが重要である。

また ICT 医療の利用は行動変容に繋がることが期待できる。健康・未病から医療まで一

貫性のある、すなわち病気になってから治療を始めるのではなく、健康なうちから取り組

んでもらえるような自己管理支援の提供が求められている。

6. 執筆担当者所感

当講座の取組みにおいて、ICT 医療の有用性が臨床研究により示され、自己管理におい

て患者自身による測定とその結果へのフィードバックが最も重要であることを認識できた

ことは注目に値する。専門医の生活指導はなかなか患者に伝わらない部分もあるかもしれ

ないが、実生活の中で測定機器とアプリを使いながら結果のフィードバックを受けると、

より具体的に生活上の問題点を捉えることができ、健康に対する意識を高められるので、

従来の医療にはないメリットがあると思われる。また、ICT を用いた臨床研究により、将

来的には、生活習慣、生活環境と疾病の関連性を検証できる可能性がある。認知症の診断

と予防は、グローバルアンメットニーズのひとつであるが、発症してからでは治療は難し

く、早期の診断が鍵となるが、例えば ICT を用いて、物忘れなどの自他覚的な臨床所見が

明らかになる以前から長期に渡り身体活動等を計測することで、認知症発症のリスクマー

カーや生活習慣と疾病の関連性が明らかになり、予防や介入が可能になるかもしれない。

一方で継続性は ICT 医療の大きな課題である。これを高めていくためにも、生活者のラ

イフスタイルにフィットした測定機器の開発や、自分の健康は、自分で守るといった意識

を醸成できるようなシステムやインフラを作る必要があり、従来にはなかった医療に対す

る考え方を、医療従事者も、患者・ユーザー側も持たなければならない。また企業側も、

医療機器として治療を行うのであれば、臨床研究において有効性と安全性を評価して実証

する必要がある。医療は責任を持って提供されるものであり、副作用等の問題が起きた際

に、対処できる体制を整備すべきである。ユーザー側も、それらがしっかりと保証された

機器やシステムであれば、信頼して使用するものと思われる。

【参考文献】

1) 東京大学大学院医学系研究科 健康空間情報学講座ホームページ、「講座概要」;

http://uhi.umin.jp/about/profile.html

2) ReferralMD ホームページ、30 Amazing Mobile Health Technology Statistics for

Page 47: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 40 -

Today’s Physician;

https://getreferralmd.com/2015/08/mobile-healthcare-technology-statistics/

3) Healthcare Information and Management Systems Society (HIMSS)ホームペー

ジ; http://www.himss.org/2015-mobile-survey

4) American Diabetes Association ホームページ;

http://www.diabetes.org/living-with-diabetes/treatment-and-care/medication/other-

treatments/mobile-prescription-therapy.html

5) Welldoc.Inc.ホームページ; https://www.welldoc.com/product/bluestar

6) 総務省ホームページ、「平成 26 年通信利用動向調査」;

http://www.soumu.go.jp/main_content/000369002.pdf

7) 厚生労働省ホームページ、平成 26 年 3 月 31 日、「健康・医療・介護分野における ICT

化の推進について」等の掲載について;

http://www.mhlw.go.jp/stf/seisakunitsuite/bunya/0000042500.html

8) 総務省ホームページ、 平成 27 年 11 月, 「クラウド時代の医療 ICT の在り方に関す

る懇談会報告書」; http://www.soumu.go.jp/main_content/000385949.pdf

9) 日本医療情報学会ホームページ、「生活習慣病 4 疾病の「ミニマム項目セット」および

「自己管理項目セット」の公開について」;

http://jami.jp/medicalFields/abtpubopen.html

10) 厚生労働省ホームページ、平成 26 年 11 月 14 日、「プログラムの医療機器への該当

性に関する基本的な考え方(薬食監麻発 1114 第 5 号)」;

http://www.mhlw.go.jp/file/06-Seisakujouhou-11120000-Iyakushokuhinkyoku/2611

14.pdf

11) Dorsey ER, et al. The Use of Smartphones for Health Research. Acad Med. 92,

157-160 (2017)

Page 48: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 41 -

〔3〕 プロジェクト「PROMPT」の概要

医療(解析センサー)機器や解析手法の特徴及び人工知能の活用の実際

ヒアリング先:

慶応義塾大学医学部 精神・神経科学教室

岸本 泰士郎 専任講師

(Hofstra Northwell School of Medicine 客員准教授)

要約

医学技術の進歩により多くの疾患領域で診断や重症度評価が急激に進歩してきたが、精

神科領域はこの流れに乗れず取り残されてきた。

そのような中、精神疾患領域において ICT あるいは機械学習を用いた技術開発に取り組

んでいるのは、慶応義塾大学医学部 精神神経科学教室の岸本泰士郎専任講師のグループ

である。「PROMPT(Project for Objective Measures using computational Psychiatry

Technology)」というプロジェクトで精力的に研究開発を牽引している。PROMPT は、日

本医療研究開発機構(AMED)による「ICT を活用した診療支援技術研究開発プロジェク

ト」の平成 27 年度委託先に採択され、2015 年 11 月から始動している。本プロジェクト

では、カメラやマイクを通して得られた患者の表情、瞬目、体動、声などの情報と、精神

科医による診断結果とを関連付けて機械学習させ、精神科疾患の客観的な重症度尺度を作

成することが可能となるような新規医療機器を含む診断システムの開発を最終目標として

いる。PROMPT は、研究期間 3.5 年のうち、2017 年度末で前半の 1.5 年を終了するが、

現時点で 200 例を超える症例のデータが集まり、試作段階でのアルゴリズムは完成しつつ

ある。

PROMPT では、1 次解析、1.5 次解析、2 次解析という段階で解析が進む。1 次解析は

表情や瞬目といった解析対象を正しく捉えることができているかという解析、1.5 次解析

は表情、瞬目、体動などのデータから疾患の重症度を見分けるような解析、2 次解析はマ

ルチモーダルデータすべてを統合した解析である。これまでに 1 次解析では、表情、瞬目、

音声、テキストマイニングなどについての機械学習がかなり進んでおり、例えば、表情に

ついては人間による評価と機械による評価が高確率で一致し、人間の感覚と近いものを機

械が特定できるようになってきている。1.5 次解析では、うつ病とそうでない人との見分

けをトレーニングしており、かなり精度の高い予測が可能になってきている。

今後の課題としては、解析精度を高めるためのデータセットの収集、医療機器としての

許認可制度の整備、倫理的・法的・社会的問題への対応、知的財産権の在り方の検討など

が挙げられる。

1.はじめに

バイオマーカー、検体検査、画像診断などの科学的・客観的指標が存在する疾患領域で

は、診断や重症度評価が急激に進歩してきた。一方、客観的指標が存在しないと言われて

いる精神科領域は、この流れに乗れず、他医学領域から大きく取り残されてきた。そのよ

うな中、慶応義塾大学医学部精神神経科学教室の岸本泰士郎専任講師は、米国への留学中

Page 49: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 42 -

に精神科領域における遠隔医療に携わり、その重要性及び有用性を実感され、日本への導

入を進められている。テレビ会議システムなどを用いると、患者の声や表情が自動的に収

集可能であり、それをそのまま解析にしてはどうかという考えから、本プロジェクト、

PROMPT(Project for Objective Majors using computational Psychiatry Technology)

がスタートした。ヒューマンサイエンス振興財団創薬資源調査班では、昨年より、ウエア

ラブルデバイスなどで集めた情報を医療に活かしてゆく取り組みを調査し、関連施設・研

究者などへのヒアリングを行ってきた。今回は、岸本専任講師の研究室を訪ね、「表情・音

声・日常生活活動の定量化から精神症状の客観的評価をリアルタイムで届けるデバイスの

開発」と題するプロジェクト PROMPT の概要及び現状を説明していただいた。

2.精神科医療と問題点

疾患が人類にとってどれくらいの負荷になっているか、という指標として YLD(Years of

Life Lived with a Disability)がよく用いられるが、精神疾患は他の医学領域を抑えて第 1

位である1)。我が国においても、精神疾患患者数は、うつ病、統合失調症、不安症を中心

に 320 万人、更に認知症を含めると 700 万人を超える。これらにかかる社会保障費用も甚

大で、うつ病で 2.7 兆円、認知症で 14.5 兆円と言われている2)。この領域に対する新しい

診断治療法の開発は日本にとっても非常に重要な課題である。

このように重要な領域であるにもかかわらず、世界的には精神科領域からメガファーマ

と呼ばれる製薬企業が次々に撤退するという事態が起こっている。その要因の一つとして、

治験の最終段階(検証試験)で、精神症状の評価(レーティング)がうまく行えず、プラ

セボに対する優越性を検証できないということが指摘されている。実際、FDA の資料によ

ると、臨床試験の失敗率は抗うつ薬が最も高く、93 試験中半数以上(51.6%)でプラセボ

との差が認められなかったとのことである。

この原因として、精神科のレーティングは客観性が無く、非常に曖昧、ということがあ

る。精神科疾患の診断は、患者との会話を通じて行われるため、患者の気分・気力・考え

方、日常生活の様子、雰囲気(表情・声・動作など)に左右される。また、精神科医は、

典型的な患者とどう類似しているのか、正常と考えられる範囲をどの程度逸脱しているの

か、などについていわば自分のモノサシと照らし合わせながら患者の診断・重症度評価・

治療を行う。このような状況が精神科疾患の重症度の定量化を困難にしており、それを改

善するために中央評価という考え方がでてきた。中央評価とは、治験への症例組み入れ等

に際し、直接利害関係のない遠くにいる評価者が、治験進捗状況などの情報を一切持たず

に評価するという手法である。

3. 精神科医療における遠隔医療

(1)遠隔医療(Telemedicine)

遠くにいる評価者が評価・診断するという、いわゆる遠隔医療(Telemedicine)は、特

に、放射線医療(Teleradiology)の現場で大きく進歩してきた。また、病理診断への応用

(Telepathology)も学会を挙げての取り組みが進んでいる。さらに Bluetooth を装備した

聴診器で遠隔の医師が心音を聞く、Da Vinci Surgical System(ダヴィンチ)という手術

支援ロボットで 3D カメラの拡大画像を見ながらニューヨークからの遠隔操作でフランス

Page 50: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 43 -

にいる女性の胆嚢を摘出するなど、遠隔医療を適用した診断や手術の実施が可能になって

きた3)。

精神科医療は、診療の大部分は患者と会話ができれば基本的に成立する。お互いの顔が

見え、声が聞こえれば診療できるため、テレビ電話(Skype レベルから高精細なテレビ会

議システムレベルまで幅が広いが)を使用して医療を行うことができる。このような考え

のもと、遠隔での精神科医療(Telepsychiatry)が海外で行われるようになり、慶應義塾

大学においても種々の実証実験を行っている。

(2)海外(米国)における Telepsychiatry の実際

岸本専任講師が留学していた米国、Zucker Hillside Hospital の John Kane 教授の研究

室では、次のような試験が行われた。統合失調症では、この疾患の治癒及び社会復帰が非

常に難しいという現実を受け、通常の治療だけでなく、職業訓練士や心理士などがチーム

で介入することで、患者の社会復帰率を上げられないかという大きな試験が、Cluster

Randomization という方法で実施された。全米 34 の施設が施設ごとにランダム化され、

ある施設の患者はインテンスな治療を受け、ある施設は普通の治療を受けて、これらのア

ウトカムを比較するために、岸本先生自身がテレビ電話で患者と話をすることでレーティ

ングを行った。他にも、引っ越した患者を Web 会議システムでフォローするというような

医療が普通に行われている。こういった米国の現状を受け、岸本専任講師は日本において

も Telepsychiatry を始めようと考えたとのことである。

米国では既に遠隔医療を実施するためのプラクティスガイドラインがあり、こと細かな

ルールが定まっている。このルールに従って行うことにより、遠隔医療の質が維持される。

認知機能検査において、実際に対面で実施する場合と遠隔で行う場合と認知機能はほぼ同

一の数値が得られており、遠隔医療で実施して問題ない、との発表が行われた4)。日本で

も早急にこのようなルールを制定していくことが望まれる。

4. PROMPTの概要5)

遠隔医療による治療効果の評価も 1 つの手法ではあるが、人に頼った患者の病状のレー

ティングは非常に曖昧で客観性に乏しい。そのため、思い切ってそれを機械にやらせよう、

という発想で、2015 年 11 月からスタートしたのが PROMPT である。客観性に乏しい精

神症状の評価について ICT 技術を用いて新たな精神科のテクノロジーを作っていけない

かというプロジェクトである。

本プロジェクトは、日本医療研究開発機構(AMED)による「ICT を活用した診療支援

技術研究開発プロジェクト」の平成 27 年度委託先に採択され、2015 年 10 月から始動し

ている。AMED からは、3 年半の研究期間を与えられており、2017 年度末まで(1.5 年)

と残り 2 年(2018 及び 2019 年度)に分けて目標設定している。第 1 段階は、できる限り

多くのデータを集め、試作段階でのアルゴリズムを作ることを目標にしている。現時点で、

200 症例を超えるデータが集まっていて、試作段階のアルゴリズムは完成しつつある。

(1)対象となる精神疾患の重症度評価における問題点

代表的な精神疾患の特徴と重症度評価を表 1 にまとめた。態度や言葉に疾患の特徴は現

Page 51: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 44 -

れ、それらをレーティングする重症度評価尺度も存在するものの、種々の問題が存在する。

それは、重症度を定量する実用的なバイオマーカーが存在せず、重症度評価を曖昧なイン

タビューの回答に頼らざるを得ないことが主要な原因である。アンカーポイントがあり、

ある程度誰が行っても同じような点数となるレーティング(重症度評価)が前提にあるが、

患者の気持ちの変化の有無やレーター(重症度評価者)の技量にも依存する。患者の心を

開いて本当に具合の悪さを吐露させることができるレーターもいれば、恐らく杓子定規に

質問してしまうレーターもいるため、これらの評価には当然差異が発生する。結果として、

治療開始のタイミングが不明確となり、治療開始判断が医師によって異なること、認知症

の診断が遅いことなど、様々な問題が発生することになる。また、治療反応がわかりにく

いため、現在の治療が効いているのかどうかを評価できない、薬剤を変更すべきかどうか

の判断も困難、となる。

表 1 代表的な精神疾患の特徴と重症度評価(岸本氏資料を改変)

疾患 特徴(態度、言葉) 重症度評価

うつ病・

躁うつ病

(うつ)

・ 暗い表情

・ 暗く、抑揚のない声

・ 動作緩慢

・ 悲観的、自責的な発

代表的レーティ

ングスケール

Hamilton Rating Scale for Depression

Montgomery- Asberg Depression Rating

Scale

評点の仕組み 以下の合計点

【自覚症状】気分・エネルギー・自殺念慮な

【生理的活動】食欲・睡眠

【他人の観察】表情・体動

問題点 判断基準があいまい

評価者がバイアスを受けやすい

時間がかかる

認知症 ・ 記憶力低下

・ 語想起障害(指示

語、抽象語)

・ 取り繕い

・ 迂言

・ 意欲や関心の低下

代表的レーティ

ングスケール

長谷川式簡易知能評価スケール

Mini Mental State Examination

ウェクスラー記憶検査など

評点の仕組み 記憶力を中心に認知機能を広く浅く

and/or 狭く深く評価

問題点 簡便なものは非常におおざっぱ

天井効果、床効果、練習効果

詳しい検査は負担が大きい(1 時間以上)

(2)PROMPT の目的

遠隔医療で患者の表情や声を見ているうちに、これらは既に画像や音声としてデジタル

化されているので、複合的に組み合わせて解析できないかという発想から PROMPT が始

まった。すなわち、コンピュータの顔認識機能を利用して患者の表情の特徴をつかんだり、

声のトーンなどの状態からうつ状態の特徴をつかんだりすることができないかということ

に取り組んでいる。最終的には、これらのデータを集約し、診療に役立つような評価手法

を作ることを目標としている。例えば、うつ病の患者は、暗くて表情変化に乏しく、硬い

表情をしている。また、うつむき加減で元気がなく声の張りがなく、話すスピードもゆっ

くりである。このような、うつ病に特徴的な精神運動抑制を定量化するのが本プロジェク

Page 52: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 45 -

トの目的である。

(3)PROMPT の全体像

本研究には、慶應義塾大学に加え、オムロン、システムフレンド、アドバンスト・メデ

ィア、FRONTEO、ソフトバンク、セムコ・テクノ及び日本マイクロソフトの各企業が、

それぞれ図 1 に示す役割で参加している。

診療現場での記録としては、カメラで患者の表情や瞬目を、また、赤外線カメラで患者

の体動の様子を捉える。また、マイクで声のトーンやスピードを解析するとともに、話の

内容そのものを解析しようとしている。ウエアラブルデバイスを用いた日常生活のモニタ

リングについては、睡眠、活動量、行動範囲などを解析する。これら診療場面や日常生活

のデータと、精神科医による従来のレーティングスケール評価結果を関連付けてコンピュ

ータに機械学習させている。以上のような過程で、最終的に客観的重症度尺度が作れると

よいと考え、それを可能とするセンサーと解析システムが一体化されたような医療機器を

作ることを念頭に置いている。

図1. PROMPT の研究開発全体像

(慶應義塾大学・岸本氏提供資料)

PROMPT の成果の実用化のイメージを図 2 に示す。患者が診察室に入ると、医師ある

いは臨床心理士と 5~10 分程度の会話を行い、その間に、カメラやマイクを通して、先に

説明したような医療データを収集する。収集されたデータは、その場で解析されるのでは

なく、一旦クラウド上に上げられてそこで解析されリアルタイムで解析結果を戻すという

システムを考えている。

Page 53: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 46 -

図2. PROMPT の成果の実用化イメージ

(慶應義塾大学・岸本氏提供資料)

(4)PROMPT の解析手法と成果(途中経過)

データ解析は、1 次解析、1.5 次解析、2 次解析という区分をしている。1 次解析は、解

析しようとする対象が正しく捕捉出来ているかという解析であり、例えば、表情として集

めたデータが本当に表情を捉えているのか、瞬目として集めたデータが本当に瞬きかとい

うことを解析する。さらに、表情、瞬目、体動などのデータからうつ病の重症度や状態を

見分けるような解析を 1.5 次解析、マルチモーダルデータすべてを統合した解析を 2 次解

析と呼んでいる。

1 次解析については、表情、瞬目、音声、テキストマイニングについて、機械学習がか

なり進んでいる。表情について言えば、Paul Ekman、Wallace Friessen らが開発したゴ

ールドスタンダード的な方法である FACS(Facial Action Cording System)6)による評

価とオムロンが開発したオカオビジョンによる評価を比較したところ、FACS 法により幸

せ(笑い)と評価された 65 枚の画像のうち、60 枚については機械も笑いと認識し、同様

に、驚き 49 枚のうち 42 枚を機械も同じ評価とした。このように、相当な確率で人間の感

覚と近いものを機械が特定できるようになってきた。また、瞬目についても非常に精度高

く認識できている、という状況が確認できている。

1.5 次解析では、うつ病とそうでない人(健常者+うつ病からの回復者)の見分けを機

械学習で判別している。まだデータ数が十分ではないが、諸外国における認識精度同等の

結果が和えられている。

(5)PROMPT の今後の課題

解析精度を高めるためには、データセットを増やすことが最も重要な課題であるが、た

だ増やせばよいというものでもなく、ディープラーニングを含む他の手法を用いたアプロ

ーチなども今後考える必要がある。また、予測精度を上げるとともに、機械がどのように

Page 54: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 47 -

予測しているのか、なぜ正解が得られたのかということについても、現時点ではブラック

ボックスとなっているが、今後ある程度明らかにしていく努力も必要である。

実用化に向けては、規制面でもクリアしなければならない点は多い。既に医薬品医療機

器総合機構(PMDA)との相談を開始しているが、単体の機器ではないという点、機械学

習という全く新しい概念を医療機器に活かそうとしている点の 2 点がこれまでとは違う全

く新しい概念であり、ハードルは高い。

倫理的・法的・社会的問題(ELSI、Ethical, Legal and Social Issues)への対応は、現

在十分に配慮して行っているが、開発されたシステムが診断以外の目的で使用されること

は避けなければならない。製品やシステムを世の中に出すときに、どのような倫理的配慮

をしてゆけば良いか、開発者自身が慎重である必要がある。

さらに、人工知能を使用した成果の知的財産についても、情報を収集する必要がある。

5.執筆担当者所感

精神科疾患は社会的な影響が大きく、罹患者数も急増している領域である。PROMPT

のような客観的な診断指標、重症度評価指標の開発は、医療的にも社会的にも経済的にも

大きなインパクトを持つ。一般企業における健康管理にも有用と思われる。一方で、カメ

ラやビデオ、音声の解析精度が飛躍的に高まる現状を見るに、ごく近い将来にデータは日

常的に氾濫することになると予測される。

また、スマートフォンに搭載される GPS 機能やさまざまな社会のセキュリティー上の

情報が個人情報と結びつき、PROMT のような解析システムと関連づく可能性があるとい

うデリケートな側面は切り離せない。医療のシステムがヘルスケアの領域に容易に連結さ

れないように、岸本専任講師が実践されているとおり、実用化の側面と ELSI 面を常に慎

重に考慮して行くことが望まれる。

【参考資料】

1) 「うつ病対策の総合的提言」日本生物学的精神医学会誌 別刷 21(3): 155 −182,

2010

2)平成 22 年度障害者総合福祉推進事業「精神疾患の社会的コストの推計」、わが国にお

ける認知症の経済的影響に関する研究(H25-認知症‐一般-005) / 研究代表者 佐渡

充洋 東京 : 厚生労働省, 2014. 平成 25-26 年度厚生労働科学研究費補助金(認知症対

策総合研究事業)

3)Marescaux, J. ,Transatlantic robot-assisted telesurgery, Nature 2001,413:379-380

4)岸本泰士郎、高齢者に対するビデオ会議システムを用いた改訂長谷川式簡易知能評価

スケールの信頼性試験. 日本遠隔医療学会雑誌 2016,12(2);145-148

5)PROPMPT ホームページ: http://www.prompt-keio.jp/

6)Paul Ekman Group ホームページ:

http://www.paulekman.com/product-category/facs/

Page 55: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 48 -

〔4〕 個人情報保護法等の改正に伴う研究倫理指針の見直しについて

要約

平成 27 年 9 月の個人情報の保護に関する法律(平成 15 年法律第 57 号。以下「個人情

報保護法」という。)の改正等に伴い、「人を対象とする医学系研究に関する倫理指針」、「ヒ

トゲノム・遺伝子解析研究に関する倫理指針」及び「遺伝子治療等臨床研究に関する指針」

が改正され、平成 29 年 5 月に、改正個人情報保護法等と同時に施行されることとなった。

今回の個人情報保護法の改正で臨床情報を取り扱う際の最も影響の大きな点は、「個人情

報の定義の明確化」と「要配慮個人情報の取扱いに係る規定の新設」の 2 点である。個人

情報の定義の明確化では、新たに「個人識別符号」が定義され(個人識別符号が含まれる

情報は個人情報に該当)、DNA を構成する塩基配列の一部が個人識別符号とされた。また、

病歴等が含まれる個人情報は「要配慮個人情報」とされ、「要配慮個人情報」を取得する場

合及び第三者に提供する場合には原則として本人同意が必要となった。

これらの臨床情報を取扱う場合であっても、「大学その他の学術研究を目的とする機関若

しくは団体又はそれらに属する者」が「学術研究の用に供する目的」で取り扱う場合は、

個人情報保護法の義務規定の適用が除外される。今回の研究倫理指針の改正に当たっては、

この適用除外規定等を広く解釈した上で、それを根拠になるべくこれまで通り研究が実施

できるよう一定の配慮がなされている。

個人情報保護法等の改正に伴う研究倫理指針の主な改正点は、「1.用語の定義の見直し」、

「2.インフォームドコンセント等の手続の見直し」、「3.匿名加工情報・非識別加工情

報の取扱規定の追加」及び「4.倫理審査体制の見直し(ゲノム指針のみ)」等である。

1.はじめに

平成 27 年 9 月に個人情報保護法が改正され、平成 29 年 5 月 30 日から施行される予定

である。この個人情報保護法の改正により、個人情報の取扱いルールが一部変更となった。

個人情報保護法の趣旨は、個人情報の保護を図りつつ利活用を促進することであるが、部

分的には個人情報の取扱いが厳格化されている箇所があり、臨床情報を用いる研究に大き

な影響を及ぼす可能性が想定された。

一方、健康・医療戦略推進会議の下に設置されたゲノム医療実現推進協議会での中間と

りまとめ(平成 27 年 7 月)を受けて、厚生労働省は同年 11 月に「ゲノム情報を用いた医

療等の実用化推進タスクフォース」を設置、具体的な施策の検討を開始したが、最初の検

討課題が「改正個人情報保護法におけるゲノム情報の取扱い」であった。タスクフォース

では、「個人識別符号」や「要配慮個人情報」として取り扱うべきゲノム情報の範囲等につ

いて議論され、これを参考に改正個人情報保護法の政省令が整備されることとなった。

これらを踏まえ、研究倫理指針の見直しの方向性について検討すべく、文部科学省、厚

生労働省及び経済産業省の 3 省合同の「医学研究等における個人情報の取扱い等に関する

合同会議」が平成 28 年 4 月に設置された。この委員会で指針の改正の検討がなされ、平

成 29 年 2 月 28 日に改正研究倫理指針が公布された。同年 5 月 30 日に施行される予定と

なっている。

Page 56: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 49 -

創薬資源調査班が 2015 年度より調査対象としている医療ビッグデータに関しては、そ

の整備と活用が大いに期待されているが、特に研究目的で使用する場合の個人情報の取扱

いは非常に重要な課題であり、今回の個人情報保護法の改正、並びにそれに伴って改正さ

れる研究倫理指針がどのような影響を及ぼすのか、取りまとめておくこととなった。

なお、今回改正の対象となった指針は、「人を対象とする医学系研究に関する倫理指針」

(以下、「医学系指針」)、「ヒトゲノム・遺伝子解析研究に関する倫理指針」(以下、「ゲノ

ム指針」)及び「遺伝子治療等臨床研究に関する指針」の 3 つの指針である。

2.個人情報保護法改正の概要

個人情報保護に関連する法律・条例(個人情報保護法等)には、民間事業者等を対象と

する「個人情報保護法」の他に、国の行政機関等が対象の「行政機関の保有する個人情報

の保護に関する法律」(平成 15 年法律第 58 号。以下「行政機関個人情報保護法」という。)、

独立行政法人等が対象の「独立行政法人等の保有する個人情報の保護に関する法律」(平成

15 年法律第 59 号。以下「独立行政法人等個人情報保護法」という。)及び地方公共団体が

それぞれ定めている「個人情報保護条例」があり、行政機関個人情報保護法、独立行政法

人等個人情報保護法は、平成 28 年 5 月に改正されているが、行政機関個人情報保護法及

び独立行政法人等個人情報保護法の改正事項は、個人情報の定義の明確化、非識別加工情

報の制度の導入等に限られるため、ここでは個人情報保護法の改正概要について整理する。

(1)概要

今回の個人情報保護法の改正概要を図 1 に示す。主な改正点は 6 点あるが、臨床研究等

にとって重要な点は、「Ⅰ.個人情報の定義の明確化」である。

図1.平成 27 年 9 月の個人情報保護法改正の概要

(文部科学省・厚生労働省・経済産業省作成資料より)

従来、個人情報のグレーゾーンが広く、個人情報なのかどうなのか判断がつかないよう

な場合、どうしても保守的に考えてしまうという状況を改善するため、個人情報の範囲の

明確化を目的として「個人識別符号」という概念が作られ、個人識別符号が含まれれば個

人情報と判断されることになった。この個人識別符号には 2 類型あり、1つは、いわゆる

Page 57: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 50 -

生体識別に使うような指紋や虹彩のデータであり、もう 1 つは、健康保険証の番号やパス

ポート番号などで、詳細は政令で定められている。今回、DNA の塩基配列データが個人

識別符号に含まれることになったため、ゲノムシークエンシングを伴う臨床研究等の実施

に当たり、大きく影響してくることが懸念される。

また、個人情報のうちセンシティブな情報については、「要配慮個人情報」という概念が

作られた。この要配慮個人情報には病歴等を含む個人情報が含まれる。要配慮個人情報を

取得する場合や第三者に提供する場合には、原則、本人の同意が必要となり、オプトアウ

ト(一定事項を本人に通知する等により、本人の求めに応じて第三者提供を停止する機会

を保障する方法)による第三者提供はできず、この部分が現行より厳しくなる。

一方で、民間事業者における個人情報の利活用を図ろうという趣旨の改正点が、「Ⅱ.適

切な規律の下で個人情報等の有用性を確保」である。この目的のため、「匿名加工情報」と

いう分類が作られた。個人情報の定義では、他の情報と照合することにより特定の個人を

識別できる情報は個人情報になるが、このグレーゾーンが広く利活用の障害になっていた。

そこで、直接本人を特定できる記述等を最低限取り除いたものを「匿名加工情報」として

定義し、識別行為の禁止、安全管理措置の実施等の一定の規律の下、本人同意がなくても

目的外利用や第三者提供ができるようになった。加工基準や取扱いについては、個人情報

保護委員会が一定の基準を示している。

他の主たる改正点は、「Ⅲ.個人情報の保護を強化(名簿屋対策)」、「Ⅳ.個人情報保護

委員会の新設及びその権限」、「Ⅴ.個人情報の取扱いのグローバル化」及び「Ⅵ.その他

改正事項」である(図 1)。

(2)適用除外となる場合

国の行政機関や国立研究所等が対象の「行政機関個人情報保護法」及び独立行政法人や

国立大学等が対象の「独立行政法人等個人情報保護法」では、個人情報の利用・提供の際

の同意原則の例外規定として、専ら学術研究目的に用いる場合等が定められている。個人

情報保護法でも、適用除外となる場合を規定した第 76 条第 1 項第 3 号があり(図 2)、「大

学その他の学術研究を目的とする機関若しくは団体又はそれらに属する者」が「学術研究

の用に供する目的」で個人情報を取り扱う場合は、法の義務規定の適用が除外されるが、

要配慮個人情報の取扱いが厳格化されることに伴い、特に、民間病院等からカルテ情報等

を収集して行う研究も適用除外となるかが問題となる。「個人情報の保護に関する法律につ

いてのガイドライン」(以下、「ガイドライン」)の通則編 P83-84 でこの適応範囲がある程

度明確化された。ガイドラインでは、『「大学その他の学術研究を目的とする機関又は団体」

とは、私立大学、公益財団法人等の研究所等の学術研究を主たる目的として活動する機関

や「学会」をいい、「それらに属する者」とは、私立大学の教員、公益財団法人等の研究所

の研究員、学会の会員等をいう』と規定された。また、「民間団体付属の研究機関等におけ

る研究活動においても、当該機関が学術研究を主たる目的とするものであって、当該活動

が学術研究の用に供する目的である場合には」適用外とされた。

Page 58: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 51 -

図2.改正個情法第 76 条:適用除外に関する整理

(文部科学省・厚生労働省・経済産業省作成資料より)

さらに、ガイドラインの Q&A において、「私立大学、研究所、学会(学会に所属する医

師等も含む。)等に限らず、1つの主体とみなすことができる共同研究が学術研究の用に供

する目的で個人情報等を取り扱う場合には、法第 4 章の規定は適用されません。したがっ

て、民間企業や私立病院等であっても、上記の1つの主体とみなすことができる共同研究

に属する者と認められる場合には、学術研究の目的に個人情報等を利用する限りにおいて、

法第 4 章の規定は適用されません。」とされ、後述の研究倫理指針の改正においても、『指

針に定める諸手続きに沿って作成・許可された研究計画書に基づく研究者等で構成される

学術研究を目的とする研究グループは、個別具体的な事例ごとに判断されるものの、その

実質や外形が 1 つの機関としてみなし得るものであるならば、研究グループに属する指針

上の「研究責任者」や「研究者等」は改正個人情報保護法第 76 条第1項第 3 号の「大学

その他学術研究を目的とする機関又は団体に属する者」に該当し得る。』と整理された。

特に疫学研究等ではすべての場合で厳密な本人同意が必要となると、これまでどおりの

研究ができなくなることから、パブリック・コメントや学会からの意見書などで強い要望

があったこと等を踏まえ、これらの解釈が明確化されたと考えられる。

3.研究倫理指針見直しの概要

個人情報保護法等の改正に伴う研究倫理指針の見直しのポイントは、図 3 に示した「1.

用語の定義の見直し」、「2.インフォームドコンセント等の手続の見直し」、「3.匿名加

工情報・非識別加工情報の取扱規定の追加」及び「4.改正指針施行前までに対応すべき

事項及び経過処置」の 4 点である。

Page 59: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 52 -

図3.個人情報保護法等の改正に伴う研究倫理指針見直しの概要

(文部科学省・厚生労働省・経済産業省作成資料より)

(1)用語の定義の見直し

研究倫理指針の見直しでは、改正個人情報保護法に従って、「個人識別符号」、「要配慮個

人情報」及び「匿名加工情報(非識別加工情報)」の定義が追加された(図 4)。

「個人識別符号」は、個人情報の範囲を明確化する趣旨で規定されたが、DNA を構成

する塩基配列の全部または一部が対象となり、実質的には対象が拡大されている。個人識

別符号については「個人情報の保護に関する法律施行令」(以下、「政令」)で細かく規定さ

れており、特に塩基配列を文字列で表記した、「ゲノムデータ」については、ガイドライン

で、「全核ゲノムシークエンスデータ、エクソームシークエンスデータ、全ゲノム SNP デ

ータ、互いに独立な 40 カ所以上の SNP から構成されるシークエンスデータ、9 座位上の

4 塩基単位の繰り返し配列等の遺伝型情報(STR)により本人を認証することができるよ

うにしたもの」等と細かく事例が示されている。

「要配慮個人情報」は、「本人の人種、信条、社会的身分、病歴、犯罪歴、その他本人に

対する不当な差別、偏見その他の不利益が生じないようにその取扱いに特に配慮するもの

として政令で定める情報が含まれる個人情報をいう」とされている(図 5)。「要配慮個人

情報」の範囲は「個人識別符号」と同様に政令で細かく規定されており、その中に病歴や

健康診断情報が含まれている。「ゲノムデータ」(塩基配列)に解釈を加えて意味を持たせ

た「ゲノム情報」はこの健康診断情報に含まれると解釈され、「ゲノム情報」が含まれる個

人情報は「要配慮個人情報」となった。「要配慮個人情報」を取得又は第三者に提供する場

合は、原則として本人の同意を得ることが改正個人情報保護法で義務化されている。

Page 60: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 53 -

図4.改正個人情報保護法で追加された用語の定義

(文部科学省・厚生労働省・経済産業省作成資料より)

図5.要配慮個人情報の概念と定義

(文部科学省・厚生労働省・経済産業省作成資料より)

今回の改正により、匿名化に関する定義の見直しが行われ、従来使われてきた、「連結不

可能匿名化」や「連結可能匿名化」は用語として廃止となった(図 6)。現行指針で「連結

不可能匿名化」され、個人情報でなくなった情報でも、ゲノムデータ等の個人識別符号が

含まれる場合が有り、必ずしも個人情報ではない情報とは限らなくなったためである。

Page 61: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 54 -

図6. 匿名化の定義の見直しと用語の廃止

(文部科学省・厚生労働省・経済産業省作成資料より)

現行指針下で連結可能匿名化あるいは連結不可能匿名化されている情報は改正研究倫理

指針においては、以下の 3 つに分類される(図 7)。

1) 匿名化されている情報(特定の個人を識別することが出来ないものであって、対応

表が作成されていないものに限る)

2) 匿名化されている情報(特定の個人を識別することが出来ないもの)

3) 匿名化されている情報

ゲノムデータ等個人識別符号が含まれる場合は、3)の「匿名化されている情報」となる。

図7. 連結不可能匿名化されている情報等の指針改正後における取扱い

(文部科学省・厚生労働省・経済産業省作成資料より)

(2)インフォームド・コンセント等の手続の見直し

今回の改正研究倫理指針でのインフォームド・コンセント等の手続き面の主な変更点は

Page 62: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 55 -

以下のようになる。最後の⑦及び⑧については、ゲノム指針では現状、個人情報に当たる

ものの第三者への提供は想定されていないが、今回の改正で塩基配列単体で個人情報とな

ったことから、オプトアウト等の手続で提供可能とされた。

① 改正個人情報保護法で規定された要配慮個人情報の取扱いに対応した規定の整備

新たに要配慮個人情報(病歴・人種等を含む個人情報)を取得して研究を実施する場

合は、原則同意が必要。

② オプトアウト手続きでの自機関利用・他機関提供を維持

法律の適用除外や例外規定に該当する場合にオプトアウトのみでの自機関利用・他機

関提供が引き続き可能。

③ 既存情報を匿名加工情報及び非識別加工情報として用いる場合の手続きの追加

匿名加工情報又は非識別加工情報のみを用いて研究を行う場合であってインフォーム

ドコンセントの取得困難な場合は手続き不要。

④ 個人識別符号のみが存在する場合のオプトアウト手続きの見直し

ゲノムデータ等の個人識別符号のみが存在する場合、拒否機会の保障が困難な場合が

想定され得ることから、そのような場合は例外として、通知又は公開をし、「原則」拒

否機会の保障(以下「原則オプトアウト」という。)を要求。

⑤ 他機関提供時の匿名化された情報の取扱い

これまで連結可能匿名化され、対応表を提供しない場合の手続きについて、医学系指

針では手続き不要、ゲノム指針では通知又は公開としていたが、今後は通知又は公開

(ただし、通知又は公開する項目は統一する)。

⑥ 通知又は公開の手続きで既存試料・情報の提供を受けた場合の手続きを追加

匿名化されている既存試料・情報を通知又は公開の手続きで提供を受けた場合、提供

先機関においては、提供元機関のインフォームドコンセント等の手続きを確認し、か

つ公開の手続きが必要。

⑦ 第三者提供時の規定を追加 <ゲノム指針のみ>

既存資料・情報を第三者提供する場合であって同意取得困難な場合について、ゲノム

データ等の個人情報が含まれる既存試料・情報を提供できる規定を追加。

⑧ 特定の個人を識別できる既存試料・情報の提供を受けた場合の手続きの追加

<ゲノム指針のみ>

特定の個人を識別できる既存試料・情報の提供を受けて研究に用いる場合、医学系指

針と同様にオプトアウト等の手続きを追加。

第三者への提供については、現行指針では提供元機関で連結可能匿名化を行い、対応表

を提供しない場合は、個人情報の第三者提供には当たらないとしていたが、改正研究倫理

指針では、提供元機関で対応表を保有する場合は、対応表を提供しない場合であっても個

人情報の第三者提供に当たる(図 8)。

Page 63: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 56 -

図8. 第三者提供における個人情報該当性の判断

(文部科学省・厚生労働省・経済産業省作成資料より)

(3)匿名加工情報・非識別加工情報の取扱規定の追加

今回の個人情報保護法改正により、「匿名加工情報」が新たに定義され、行政機関個人情

報保護法と独立行政法人個人情報保護法では、「非識別加工情報」として定義されている。

いずれも個人情報を特定の個人が識別できないように加工し、かつ、当該個人情報を復元

することができないようにしたものである。内閣府の外局として設置されている個人情報

保護委員会の規則に基づく匿名加工基準に従い適正に加工することや個人情報保護法が適

用される民間事業者において識別行為を禁止するなど一定の規律の下、本人同意を得ずに

利用・提供することが可能であり、民間事業者におけるパーソナルデータの利活用を促進

するものである。

匿名加工情報や非識別加工情報の取扱いや取得・提供時の手続きについては図 9 のよう

に整理されている。新規の取得時はインフォームドコンセントが必要である。既取得の試

料・情報を用いて匿名加工情報等を作成し、自機関で利用するケースや他機関に提供する

ケースにおいては、原則インフォームドコンセントが必要であるが、取得困難な場合は同

意に関する手続きは不要である。

図9. 匿名加工情報の取扱い(文部科学省・厚生労働省・経済産業省作成資料より)

Page 64: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 57 -

(4)改正指針施行前までに対応すべき事項及び経過処置

現行指針に基づき現在実施中の研究については、経過措置が設けられていないため、改

正研究倫理指針の施行前までに研究計画書の変更など、必要な措置を取る必要がある。新

たにインフォームドコンセントが必要になったケースでは、倫理審査委員会の承認も必要

となる(図 10)。行政よりチェックリストが配布されているので、それを参考に研究計画

ごとに確認する必要がある。

図10. 現在進行中の研究の改正研究倫理指針への対応方法

(文部科学省・厚生労働省・経済産業省作成資料より)

また、現行のゲノム指針では、倫理審査委員会を研究機関ごとに設置し、共同研究の場

合は各参加機関の倫理審査委員会がそれぞれ審査することになっているが、今回の改正で

は、他の研究機関に設置された倫理審査委員会に審査を依頼することが可能になり、必ず

しも全ての研究機関が倫理審査委員会を設置しなくても良くなる。また、共同研究に関し

ては1か所の委員会による一括審査のみでも良いとしている。(図 11)。

図11. ゲノム指針における倫理審査の体制の見直し

(文部科学省・厚生労働省・経済産業省作成資料より)

Page 65: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 58 -

4.改正研究倫理指針の公布・施行に至るスケジュール

文部科学省、厚生労働省及び経済産業省の 3 省合同の「医学研究等における個人情報の

取扱い等に関する合同会議」は平成 28 年 4 月より 12 月まで 9 回開催され、改正研究倫理

指針の検討がなされた。その間、平成 28 年 8 月に説明会が開催され、続く 9 月から 10 月

までパブリック・コメントの募集がされた。これに対して、延べ 2,000 件を超える意見が

提出された。これらコメントも踏まえ、12 月に最終取りまとめが行われ、法令的な観点か

らのチェックがなされた。平成 29 年 2 月中に公布、3 か月の周知期間を置いた後、5 月

30 日に改正個人情報保護法と同時に施行となることが予定されている(図 12)。(注:平

成 29 年 2 月 28 日の官報で改正研究倫理指針が告示された。)

図12.改正研究倫理指針の公布・施行までのスケジュール

(文部科学省・厚生労働省・経済産業省作成資料より)

5.今後の展望と課題

今回の指針改正に関する合同会議での審議は、実質 9 か月程度で行われた。次回の見直

しは、現在審議中及び検討中の、「臨床研究法」、「医療分野の研究開発に資するための匿名

加工医療情報に関する法律」の 2 つの法律の施行に合わせたタイミングが想定される。

また、平成 28 年 12 月の合同委員会の最終取りまとめでは、中長期課題として指針のあ

り方について医学系指針とゲノム指針の一本化を明示したことから、次の改正のタイミン

グで議論の対象になると考えられる。

6.執筆担当者所感

今回の個人情報保護法の改正に伴う研究倫理指針の見直しでは、遺伝子配列情報が個人

情報とされたことから、これまで行われてきた研究ができなくなるのではないか、特に疫

学研究等、継続性が重要な研究が重大な影響を受けるのではないかと懸念された。学会等

からの要望やパブリック・コメントの多くの意見を踏まえ、最終的には継続した研究が行

えるようになったようである。しかし、改正内容の周知期間や経過処置期間も短く、実際

にどのような影響がこれから出てくるのか予測のつかない面もある。

個人情報保護法の改正とそれに伴う研究倫理指針の改正の詳細については、正直かなり

Page 66: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 59 -

分かりにくい点が多い印象がある。文部科学省、厚生労働省及び経済産業省の 3 省では、

同一の資料を用いて説明会等で解説に努めているようである。そこで出された意見等を参

考にして、ガイドラインや Q&A でできるだけ多くの事例等を挙げ、研究者に分かりやす

い情報の発信を期待したい。

参考資料

1) 個人情報の保護に関する法律 http://www.ppc.go.jp/personal/legal/

2) 個人情報の保護に関する法律施行令・施行規則(平成 28 年 10 月 5 日公布)

http://www.ppc.go.jp/personal/preparation/

3) 個人情報の保護に関する法律についてのガイドライン(平成 28 年 11 月 30 日告示)

・通則編 http://www.ppc.go.jp/files/pdf/guidelines01.pdf

・外国にある第三者への提供編 http://www.ppc.go.jp/files/pdf/guidelines02.pdf

・第三者提供時の確認・記録義務編

http://www.ppc.go.jp/files/pdf/guidelines03.pdf

・匿名加工情報編 http://www.ppc.go.jp/files/pdf/guidelines04.pdf

4) 文部科学省ライフサイエンスの広場

・科学技術・学術審議会 生命倫理・安全部会

ライフサイエンス研究における個人情報取り扱い等に関する専門委員会

議事次第・議事録 http://www.lifescience.mext.go.jp/council/council015.html

5) 文部科学省科学技術・学術審議会 生命倫理・安全部会(第 35 回)

http://www.lifescience.mext.go.jp/2016/12/35281212.html

※改正案の現時点版が掲載

6) 文部科学省 「人を対象とする医学研究に関する倫理指針」等の一部改正について

(平成 29 年 2 月 28 日) http://www.mext.go.jp/b_menu/houdou/29/02/1382725.htm

7) 個人情報保護法等の改正に伴う研究倫理指針の改正について(平成 29 年 3 月 24 日)

http://www.lifescience.mext.go.jp/files/pdf/n1868_02.pdf

Page 67: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 60 -

第2節 オミックスデータからの創薬

はじめに

ヒューマンサイエンス振興財団創薬資源調査班では、これまでもオミックスに関する調

査については、多層的オミックス、メタボローム解析、プロテオーム解析などの研究動向

を、特にバイオマーカー探索を中心に紹介してきた。今年度は、創薬研究にオミックスデ

ータをはじめとしたビッグデータをどう利活用、解析するかに焦点を当てた。オミックス

データの特徴は、1 個数から得られる属性の多さである。この複雑系データ集団をどのよ

うに解析し、関連のある情報を引き出すのかが、オミックス情報からの創薬標的探索、シ

ーズ探索おいて鍵となる。また、データ解析には、オミックス情報だけでなく、患者背景

などの医療情報や画像データなどもその対象となる場合もあり、より複雑なデータ分析と

なる。

本節では、このような複雑系データ解析において重要となってくる遺伝統計学について、

京都大学大学院医学研究科、統計遺伝学分野、山田亮教授にヒアリングを行い、その概要

を紹介した。また、オミックス情報を用いたアカデミア創薬の代表であるドラッグリポジ

ショニングについて、国内を代表する九州大学生体防御医学研究所、システムコホート学

分野の山西芳裕教授ならびに産業技術総合研究所創薬分子プロファイリング研究センター

の堀本勝久副研究センター長にそれぞれヒアリングを行い、オミックス情報、各種データ

ベースを用いた数理的なデータ解析手法についての技術概要と成果ならびにこのような研

究を進める上での課題について概説した。

Page 68: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 61 -

第2節関連ヒアリング先とヒアリング概要

ヒアリング先 概要

1

京都大学

大学院医学研究科

統計遺伝学分野

山田 亮 教授

「ビッグデータ解析における遺伝統計学の役割、及び

個別化医療への活用に関する展望と課題」

多様かつ大量に産出される複雑なデータの解析は、従

来の p 値を出して有意性を判断する医療統計学や生

物統計学の手法では対応できない。そのため、ビッグ

データ分析において、遺伝統計学は有用な手法の一つ

である。データ解析に関する学術上の課題のほかに、

有用なデータの取得のための体制や、治療法の選択な

どを目的とした解析結果の受け取り方など、行政的・

社会的な課題の解決も望まれる。複雑な遺伝統計学の

考え方等について解説。

2

九州大学

生体防御医学研究所

システムコホート学分野

山西 芳裕 准教授

「各種ビッグデータの解析からの新規創薬標的分子

の探索やドラッグリポジショニングへの活用の現状

と今後の課題」

ゲノム、トランスクリプトーム、プロテオーム、メタ

ボローム、フェノームなどの網羅的オミックスデータ

から様々な分子間相互作用ネットワーク(タンパク質

間相互作用、代謝パスウェイ、タンパク質リガンド相

互作用など)を予測する数理学的手法を開発してお

り、ついてその取り組みに解説。

3

産業技術総合研究所

創薬分子プロファイリング

研究センター

堀本 勝久 副研究センター長

「オミックスデータを活用する創薬の IT ブ―スティ

ング」

網羅的なオミックスデータが創出されるようになり、

「仮説を立て、ゴールを設定してデータを集め、検証

を積み重ねていくことが新たな発見に結びつく」とい

うコンセプトに基づき、3 つのドラッグリポジショニ

ングの事例を使って紹介に加え、アカデミア創薬の取

り組みと現状について解説。

Page 69: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 62 -

〔1〕 ビッグデータ解析における遺伝統計学の役割、及び

個別化医療への活用に関する展望と課題

ヒアリング先:

京都大学大学院医学研究科

附属ゲノム医学センター 統計遺伝学分野

山田 亮 教授

要約

統計学には、曖昧さを認めない治験のような堅い分野を支えてきた、いわゆる医療統計

学や生物統計学と呼ばれる分野がある一方、統計学を生んだ母体ではあるが、曖昧さを許

容し、ベイズ統計などを用いる、遺伝統計学と呼ばれる分野がある。生命科学系の実験の

ハイスループット化に伴い、多様かつ大量に産出される複雑なデータの解析は、従来の p

値を出して有意性を判断する医療統計学や生物統計学の手法では対応できない。

生命現象は多様であり、疾患発症も同様に多様である。そのため、複雑な生命現象の解

明においては、単純なフェノタイプだけでなく、ゲノムやオミックスなど多様なデータの

解析が求められている。遺伝統計学は、遺伝的多様性と環境的多様性との組み合わせを数

理的に表現し、複雑な事象を解明するための学問である。遺伝統計学では、すべてのデー

タをジェノタイプ(遺伝子型)とフェノタイプ(表現型)に分け、ジェノタイプがフェノ

タイプにどのように、あるいはどの程度影響しているのかなどを明らかにする。分布や形

といったものも含むフェノタイプのデータは、1 個 1 個の観測自体が非常に複雑であり、

しかも時系列で取得する必要があることなどから、情報学的・統計解析的な難題が数多く

ある。

このような難題に対処するために、生命科学と統計学に加えて、理論数学や情報学を取

り込む必要がある。さらに、数学は、人工知能が出した通常では解釈不能な答えの見方を

示すことができる。

データ解析に関する学術上の課題のほかに、有用なデータの取得のための体制や、治療

法の選択などを目的とした解析結果の受け取り方など、行政的・社会的な課題の解決も望

まれる。

1. はじめに

ゲノムやその他のオミックスデータを統合して解析する多層オミックス解析や、健康医

療データの解析により有用な情報を導き出すアプローチは、次世代シーケンサーや計算機

などの機器、機械学習などの情報処理手法の進歩と相俟って、大きな期待を集めている。

そこで今回、生命科学や医学の研究において生み出される多種多様な大量のデータの解

析を支える統計学の基本及び課題について、そのアプローチの全体像を掴み、概念的な理

解を進めるために、山田教授にお話を伺った。

2. 遺伝統計学 ―医療統計学・生物統計学との違い―

統計学には、ルールが固まり、曖昧なことは許さない治験のような堅い分野を支えてき

Page 70: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 63 -

た、いわゆる医療統計学や生物統計学と呼ばれる分野がある一方、歴史的に統計学を生ん

だ母体ではあるが、曖昧でも仕方がないとする、遺伝統計学と呼ばれる分野がある。

医療統計学は、コンセンサスを得るために、最終的に p 値というものに還元して、p 値

に基づいて、薬の認可あるいは不認可を決定するというような形で、白黒をはっきりする

ことが基本となっている。

一方、遺伝統計学は、ある意味流行となっているベイズ統計などを用いて、事前にある

程度、このような感じではないだろうかと予想する(事前確率)、その上で、データを見て、

その結果データを使って、自分の予想を改訂して、より確からしい予想(事後確率)を求

める、といったことを重視する。

この 2 分野の違いは、白黒を付けたいかそれとも曖昧さを残すかであり、扱うデータに

も違いがある。また、ある集団(健常者、患者、細胞集団など)を空間と捉えるならば、

その空間における多様な状態や時系列空間、すなわちノンパラメトリックな動的空間モデ

ルでの数理的解析といった点においても、通常の統計学とは異なる。

生命科学系の実験のハイスループット化が進み、次世代シーケンサーなどにより、大量

のゲノムやオミックスのデータが生み出されている。そうなると、特定のデータに基づき

綿密に実験計画を立てて p 値を出す医療統計学や生物統計学とはやり方を変えないと、デ

ータの取り扱いができない。大量に取得してしまったデータを、相互が独立だと捉えて処

理できないということがある。

また、計算機や情報分野に資金投資をしたからと言って、非常に雑多なビッグデータの

解析について、皆が簡単にコンセンサスを得るような形で答えが出るなどというようなこ

とはない。それぞれの専門家がそれぞれの根拠に従って答えを出し、真実がたくさん出て

きてしまうような状況にある。すなわち、同じデータセットを解析しても、流儀によって、

言うことが違ってくるということになる。

3. ジェノタイプとフェノタイプ

遺伝統計学では、すべてのデータをジェノタイプとフェノタイプに分け、ジェノタイプ

がフェノタイプにどのように、あるいはどの程度影響しているかを明らかにする(図 1)。

図1.分子遺伝学の構図

(京都大学・山田亮教授提供資料)

Page 71: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 64 -

フェノタイプは、いつどこを取るかで異なる。しかし、ゲノム配列は、フェノタイプに

よって書き換えられることは基本的にないので、ジェノタイプの影響は、フェノタイプに

一方向に向く(図 2)。ゲノムの方は一つのかたまりであり、それ以外は全部、どういう分

類があってもフェノタイプと呼び、分類や分類間の相互作用がものすごく複雑になってい

るという構図である。

エピゲノムの状態は、タンパク質の発現量によって制御を受ける可能性が有り、mRNA

の発現、又は RNA の分解もタンパク質の影響を受ける可能性が有る。また、機能性 RNA

は何かしらのタンパク質につながるかもしれない。そして、タンパク質もフェノタイプを

決定する。

図2.個体に現れるフェノタイプ

(京都大学・山田亮教授提供資料)

(1)ジェノタイプ

ジェノタイプは、基本的に、受精卵として遺伝情報を受け取ると、その個体については、

時空間的に、いつ測っても、どこの細胞を取っても同じと考えられる。

しかしながら、生殖細胞系列に、ある個人の中で変異が発生すると、それは de novo の

全く新しい変異として次世代につながる可能性もある(図 3:M1、M2)。

Page 72: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 65 -

図3.個体の時空間

(京都大学・山田亮教授提供資料)

それ以外の体細胞の方は、結構多くの変異が入るが、入る変異は基本的には機能的に中

立なので、問題にならない。ただし、がんのような細胞の無限増殖能を引き起こすような

変異が体細胞の変異として入ることもある(図 3:M4)。

それ以外に、一部の細胞が機能性の DNA 変化を体細胞変異として起こせば、何かしら

病気になる可能性がある(図 3:M5)。これまで、細胞数が少なくなかなかピンポイント

で解明できなかった。しかし、最近はシングルセルでのシーケンシングができるようにな

ったため、このような細胞の存在と未解明の病気が結び付けられるかもしれない。

また、生まれる前に体細胞の変異が起きると、それが分裂してできる多数の細胞、体の

一部は、その変異を引きずることになる(図 3:M3)。ここで起きた変異が全身に起きて

いると、重篤な遺伝病を起こす場合がある。体のある一部分だけが、小児性のいわゆる重

篤なメンデル遺伝のバリアントを持つことから、モザイク型のメンデル遺伝は説明できる。

体内の数パーセントの細胞がバリアントを持っているために、メンデル遺伝病のごく軽

症型を発症しているのではないかなど、体中のどの細胞にどういう変異があるのかを調べ

ることにより診断とその対策ができるようになってくる。

次世代シーケンサーで細胞を個別に扱うことができ、山のようにデータを取得できるよ

うになったのは大変な進歩であるが、今はどちらかというと、解析手法がそれに追いつい

ていないのが実際のところである。

(2)フェノタイプの多様性

フェノタイプは多様であり、身長やコレステロール値などの検査値とか、ある疾患の有

無という簡単なフェノタイプだけではない。細胞の表面マーカー発現量の分布もフェノタ

イプであり、最近では画像技術が発達し、画像データもフェノタイプとして捉えられる。

したがって、個人の特徴や細胞の特徴などの個々のデータ自体が、今まで統計学が取り扱

ってきた「値」ではなくなってきている。それぞれの捉えどころがどこなのかを定めなが

Page 73: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 66 -

ら進めていかなければならず、情報学的・統計解析的な難題が数多くある状況にある。

例えば、細胞表面の各種マーカーの発現量をフローサイトメーターで解析すると、発現

量の分布自体がフェノタイプとして出てくる。これまでの統計学は、整数や実数に対して

検定、回帰分析、分散分析などを実施していた。しかしながら、分布が 1 人 1 人に出て、

これを 1,000 人集めたときには、誰と誰の分布が似ていて、どういったサブタイプに分け

られるのか、サブタイプとどこかの遺伝子やバリアントが関係するのか、などを対象にし

なければならない。

最近のフローサイトメーターは、チャンネルの数が従来品より多く搭載されている機種

もあり、絵で描けないぐらい高次元の分布が 1 人分の観測から出るし、その 1 人から出る

データが、取得する時刻によって、大きく変わることもある。そのような意味で、フェノ

タイプは個々の観測自体がものすごく複雑度を増していて、しかもそれを時系列で取らな

ければならない場合もある。

こういったデータを全部入れて、実験誤差や、どこがゴミかということも含めて、人工

知能(AI)が解いてくれればよいのであるが、それほどうまくはいかないだろうと考えら

れる。AI の課題の一つは、学習させる情報の質と言われている。学習させる医療情報・健

診データにはノイズが多い。その情報の精査が可能なものとそうでないものがある現状で

は、現時点における AI の成果は、医療や生命科学の分野では、限られた領域に限定され

ると思われる。また、別の課題として、回答を引き出す過程が示されないことがある。AI

のようなブラックボックスに入れてしまうと、答えは出たけれども、どのような解釈をし

て結果が出たのかというところまではわからない。

また、画像データといったものなども、解析の対象となる。丸く表面に凹凸のない良性

のポリープと、カリフラワー状の膀胱がん、そしてその中間のような状態について、AI

を用いることで職人技に頼ることなく判断しようとしている。

放射線診断学や組織病理といった 2 次元の画像の解析では、ディープラーニング(深層

学習)といった AI が、かなり進んできている。一方、山田教授らは、3 次元の形というも

のを、どのように統計的な解釈に結び付けるかという研究を進めている。CT や MRI、そ

して細胞や発生の様子などからも、3 次元の形の情報を得ることができ、研究対象となる。

このような画像データもフェノタイプであり、画像を分割し、セクション毎に記述変換さ

せれば、基本的には統計解析は可能となる。

この分野の難しい点は、別々の場所(部位)に関する値が相互に非常に関連が強いこと

である。時系列のデータも同様に、前の値がどうだったかということと独立して解釈する

わけにはいかない。時系列のデータは、統計学ではいわゆる経済統計の分野が最も得意で、

一大分野を形成している。経済統計と医療統計などが、これまで別々に研究が行なわれて

きた理由は、いわゆる医療統計というのはすべてのサンプルが独立だと仮定した上で、い

ろいろな解釈をしている一方、経済統計では、ブラックマンデーのような非連続的で急激

な変化が起ころうと、時間という軸に関して相互に関連を持った値のかたまりとして、デ

ータを解釈しようとしているからである。

時系列統計についてもまだその手法は必ずしも確立されておらず、不確定な要素も多く

存在するが、さらに、3 次元の形となると、相互関連が更に多次元となり、更に難しい問

題が生じる。例えば、脳の表面はしわや凹凸があるが、やはりつながっている。そのため

Page 74: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 67 -

に、脳表面で電気の刺激が行き来する場で、fMRI などの撮影を行う場合、隣の場所とそ

んなに無関係に相違があってはならない、というような制約が多く入ったデータが取れて

きてしまう。そのような場合には、幾何学を使いながら解析しなければならない。1 次元

の連続データ解析すら、統計学ではまだ難しく、統計学だけで対応していても解決できな

い。これらに関しては、理論数学・純粋数学の捉え方を取り入れていかないと解析できな

い。山田教授は、生命科学と統計学に、理論数学を取り込む方向で努力することを考えて

いる。

別のアプローチとして、これまでの生命科学と統計学に、情報学というものを取り入れ

ようとしている研究者も多くいる。「京」や「TSUBAME」といった高速なコンピュータ

ーを利用したり、新たなアルゴリズムを開発したりしているが、恐らくその両方をやって

いく必要がある。

(3)シングルセルのトランスクリプトーム

培養細胞であっても、異なる細胞の集団であり、すべての細胞が、同じような刺激で、

同じような時系列で変化するわけではない。また近年、がん組織中のがん細胞の不均一性

も明らかとなり、治療抵抗性の原因の一つとして注目されている。また、免疫細胞では、

そのポピュレーションはますます細分化されてきている。そのため、シングルセルでの解

析が注目されている。シングルセル解析は、次世代シークエンサーの出現及びセルソータ

ーの技術の向上によって、その解析が可能となり、免疫学やがん領域で活用され始めてい

る。

しかしながら、シングルセルのトランスクリプトーム解析には次のような問題もある。

遺伝子の発現は時間的にサイクルで動いているので、mRNA ができた瞬間に標本を取ると、

mRNA 分子は検出できるが、ちょうどそれが分解された時だとなくなる。したがって、シ

ングルセルのトランスクリプトームを RNA-seq 解析すると、ゼロインフレーションとい

って、本当はあるはずなのに検出されない遺伝子が山ほど出てくる。細胞 100 個であれば

うまく測れていたのに、1 個にしたら測れたり測れなかったりする。1 個にするとあった

りなかったりするので、量子力学のような世界になっている。今、生物学のデータの取り

方は、力学でいえば古典力学のような大きな部分と、量子力学のような小さな世界の両方

が測定できる時代になっている。

ノイズや、観測によるアーチファクトが入ったりする可能性が有り、簡単ではないが、

ミクロな観測から全体を理解することは、非常に面白い分野である。

4. 統計解析手法の俯瞰

ゲノム・オミクス研究での統計解析手法を俯瞰すると、図 4 のようにまとめられる。

Page 75: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 68 -

図4.ゲノム・オミクス研究での統計解析手法の俯瞰

(京都大学・山田亮教授提供資料)

(1)ハイスループットデータのクオリティコントロール(QC)

次世代シーケンシングなどから、高速でデータが出てくるが、クオリティコントロール

(QC)が必要である。しかしながら、実験ごとに、うまくいってないからと選り分けるわ

けにいかず、全体を失敗も込みとして解析することになる。結果的に、実験データにノイ

ズがあることを承知した上で、そのノイズを消化して、QC をして使える形にする。

データの質を左右するものには、理由があって発生するバイアスやノイズと、理由が分

からないものがある。理由がはっきりしているものについては、理由を確認した上で除去

しても良いが、それ以外のものは判定できないため、かえって研究者のバイアスが入って

しまうので、基本的に除去しない方が良い。それぞれの要素間でどのような相互関連性が

あるかがわからない時点では選別はできない。したがって、余り除去できるものはない。

何となく見つけた悪いものだけをピックアップして排除しても、排除のクライテリアが統

一できず、アーチファクトのようなものが発生する。旧来型の統計の手法は、外れ値を除

かなければうまく回らないものが多い。パラメトリックな手法では、分布から外れたもの

は困るからである。

(2)検定・推定・分類、多次元・高次元データ、乱数を使ったアプローチ

QC の後、大きく行う作業は、p 値を出す検定、あるいは、p 値は関係なく、既に違いが

あることは分かっているため、どのようなモデルに合うかを考える推定である。分類もよ

く行う作業である。診断する、病気か否か、この薬は効くのか否かというのは、全て分類

である。分類するのは決断するためであり、分類をしないと医療は先に進めない。これら

の、検定、推定、分類が三大統計処理である。

また、先述した、フローサイトメーターで 32 次元になってしまったり、遺伝子を全部

扱うと 2 万 5,000 次元になってしまったりする高次元のデータや、分布、形、隣と関連が

あるデータといった、扱いにくいデータに対して、情報系の専門家と共同で、乱数を使っ

たアプローチをとることがある。データが複雑になってくると、乱数を使ったアプローチ

でないと有効な解析が行えなくなるため、このような場合、今後統計学を専門とする研究

者と情報処理を専門とする研究者がすり合わせていくことが必要となる。乱数を使うと、

やるたびに答えが少しずつ違うため、行政関連ではこの乱数を使ったアプローチはあまり

Page 76: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 69 -

歓迎されないが、今後どう扱っていくのかは課題である。

5. ベイズ推定の考え方

基本的には、違うだろうということをベースにして、もしかしたら本当かもしれないと

いうのを担保するものが p 値であるが、生物現象は基本的に均質ではなく偏りがある。

例えば、Genome Wide Association Study(GWAS)は、30 億塩基対のゲノム上のどこ

に、ある病気の関連ドメインがあるか分からないといった状況の中で、1 か所もないかも

しれないと思ってデータを得る。その際には、p 値を使って解釈すればよい。なぜなら、1

個もなくても、それが本当かもしれないからである。もし 1 個あるならば、p 値が小さく

なければならないということになる。

一方で、例えばがん細胞と正常な細胞を比べた際に、もちろん違いはある。どこがどう

違うかを調べる場合、p 値を使っても意味が無い。そのような場合には、False Discovery

Rate(FDR)という手法がある。

ここで、見た目が違うのだから違うに決まっているということが、事前の思い込みであ

り、事前の思い込みというのが、ベイズ理論の統計でいうところのトライアル、事前確率、

事前分布と言われるものである。ただし、事前が違うといってもどのくらい違うのか、正

確には分からない。その違いは、介入することにより変化させることが可能な違いなのか

どうかを強く意識している。

実際の医療現場では、もともと p 値などは使用していない。ベイズ流の考え方がよく浸

透している。患者さんが来院して、「具合が悪いんですけど」という時に、「病気じゃない

かもしれない」という、確率ゼロからスタートして患者さんを診ていたら、皆帰さなけれ

ばいけない。医師は、事前の確率はいくつにするかなどを考えずに、このくらいかなとい

う感触に基づき診療している。そのあたりを理論にするのは非常に難しい。

そこに遺伝情報を入れて、プレシジョン・メディスン(精密医療)にしようという時に、

その遺伝情報のところの計算だけ精細に行っても、その前のところが“もやっ”としてい

る。この“もやっ”という情報を織り込みながら患者さんと話して、最終的な決断にもっ

ていく必要がある。医師によっては、一方的に「データに基づくとこうです」、「簡単に言

うとこうです」と言い切ってしまうことがある。しかし、情報はそういうものではない。

自分の生理的な判断基準によってうまくそれを受け止められない時は受け止めないとする

のは、生物としてはなかなか良い戦略かもしれない。

6. 解析結果の解釈とそれに基づいた決断

(1)AI の出した結果の解釈

AI は、静的なデータだということを認識しながらデータを処理するような仕組みではな

い。何かしらフォーマットを決めれば、時系列のデータであろうと空間のデータであろう

と何であろうと、入力すれば、それなりにフィルタリングするなり特徴抽出なりして結果

を返してくる。問題は、それに対して、人間がプロトタイプ解析をしていないので、結果

を解釈することができないということである。

遊びやゲームとは違って、治療法の選択などにおいては、解釈ができなければ、やはり

それを使うのは不安である。チャレンジングに行く人もいるかもしれないが、すべての人

Page 77: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 70 -

がそれで良いかというと、恐らくそうではない。AI に全部任せる前に、誰かが何かしらの

説明を付けないと、大多数の人が受け入れるとは考えにくい。

AI が出した、普通には解釈不能な答えに対し、数学は、どういう理論に支えられている

のかというところを示し、大多数の人が納得できるレベルの説明を可能にすることが期待

される。

(2)解析結果に基づく決断

遺伝統計学の分野では、情報を使ってどのように決断するかというような話もする。

生物が何十億年も絶滅しないで生きながらえているのは、個体ごとに決断の仕方が違う

からであり、同じ状況下に置かれたときに全員が同じ選択をするということはそれだけ絶

滅のリスクが高くなる。

病気の治療法の選択なども、ある意味そのような側面がある。A という治療法と B とい

う治療法を治験で比較して、A がよいということになると、今は A しかやらなくしてしま

う。しかし、白黒はっきりするタイプの治験はそれほど多くない。全員が A を選び続ける

と、B についての情報が得られないままとなる。

いろいろな解釈があり得る情報の提供を受けたときに、個人個人が違う選択をする遊び

がないと、生命が成功してきた、「あまのじゃくを含んでいるので失敗しない」という戦略

から、転げ落ちてしまう。決断に多様性がある方が集団は安定するということからも、解

析結果の受け取り方が、ばらばらでもかまわないというコンセンサスが醸成された上で、

情報やその解釈を出せる環境になることが望ましい。

現代は、思考偏重で、パターナリズム的に、理論的にはこうした方がいいという強制力

が強い。統計学で情報を提供するということは、これをお勧めするというように一般的に

は思われているが、実はそうではない。統計学は、「こうですよ、でも絶対そうであるわけ

ではないのですよ」とずっと言い続けている。

遺伝子診断の結果を使った決断において、アンジェリーナ・ジョリーのような、BRCA1

遺伝子変異の保持による乳がんや卵巣がんになる確率は、メンデル遺伝にかなり近いタイ

プの遺伝形式のために、狭い推定区間の情報が提供できる(乳がんで 87%〔95%信頼区間

72-95%〕)。一方で、それ以外のコモンながんの場合は、例えば一般人に比べて 1.8 倍なり

やすいなどというデータがあった場合、1.2 倍から 3.7 倍までの間のどこかだけれども、

あえていうなら 1.8 倍というレベルでいっている。いわゆる普通の疾患(コモンディジー

ズ)のリスクの区間推定は、その幅が非常に広い。データは受け取る人がどう使うかによ

りけりで、使い方さえ間違えなければ、どのようなデータや情報を提供しても悪くはない。

7. コホートデータや医療データの取得の課題

(1)先制医療とコホート研究

未病状態の特定には、健康なネットワークの状態と少しだけずれているというようなも

のを見つけないといけないので、少なくとも複数のものに、何かしらのモデルを入れ、選

り分けなければならない。ただし、健康状態と未病状態は、白黒ではなくて恐らく連続的

なものになっているので、解析は厄介だと思われる。未病の人は、フェノタイプの観測が

難しいので、病気になるところまでコホートで追いかけていかなければ、最終的には分か

Page 78: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 71 -

らない。したがって、ケースコントロールで比較するときには、必要な例数を集めるのは

簡単であるが、未病の人が実病に転ずる人数を稼ごうと思うと、相当の数を解析しなくて

はならない。しかもネットワークとして見る必要があり、時空間的に多様なので、多くの

人に対して、何度もデータを取らないと分からない。

したがって、コホート研究は短時間では成果をあげられないが、大量に投資する、十何

年、何十年の単位でずっと続けるという我慢が必要となる。コホート研究は、プロジェク

トとして実施する必要があるが、立ち上げの時には面白いからと優秀な人材が集まるが、

メンテナンスの時期になって、成果が出ないと言われても続けられるように、必ずここま

で続けるという保証が必要である。

(2)医療データの取得の諸問題

電子カルテからのフェノタイプ解析などについて、表記ブレがあるので難しいからやら

ない、入力しても成果が出ないから、と言ってひるんでいる場合ではない。まずは入力し、

どういう表記ブレがあるのかを集計結果から知り、その表記ブレが発生する原因を見つけ

る。そして、インセンティブに基づいて、どういうふうに揃えたらいいのかというステッ

プを踏まなければならない。15 年前から同じ議論があり、進んでいない。レセプト用の病

名と本当の病名が違った場合でも、研究用としてレセプト病名とは切り離すとすればよい。

また、データ使用のハードルが高い。使用に必要な条件や煩雑な申請手続きなど、何を

行うにしても非常にハードルが高く、現場は辛い。特区などとして利用を加速し、問題抽

出をしていくことをするべきであろう。

また、データはあれば良いわけではなく、情報が「ない」ということの意味がわかる現

場の情報リテラシーも大事である。「なし」と入力することと、「入力しない」ということ

の違いは、情報リテラシーの基本であるが、現場ではその辺がうやむやになっている。「な

し」が重要であり、それが入力されていないことが何を意味するのか、情報を使う側とな

って実感すれば、その研究者(データ入力者)は一歩前に進む。鶏と卵のようなところが

あるが、情報を使う環境に身を置くと、情報はどうあるべきなのかということを学ぶ機会

が増えるので、情報の入出力の能力が向上する。しかし、それがないと、多少技術が進歩

しても、なかなかリテラシーが上がらない。入力することと使用することは不可分であり、

使用するところまで行って初めてリテラシーが身につくものである。

8. 執筆担当者所感

今回は、ともすると看過されがちな、思想的・哲学的とも言える視点から、複雑なデー

タを扱い、実用に役立てる際の注意点を、俯瞰して認識することができたと思われた。

生命現象・病理現象の統計解析は、データ取得の高速化・高度化により、急激に複雑度

を増し、入口(データ取得体制構築など)から出口(結果の解釈と利用)まで、多くの課

題に溢れている。

解析方法の進歩により、個別の状態(個々人、タイミングなど)に応じた、最適な治療

薬や治療法が推定され選択できるようになることが期待される。また、単一遺伝子疾患と

は異なり、普通の疾患は分子ネットワークの異常と言えるものである。それゆえ、将来の

治療薬は、複数の標的分子を同時に狙うことが一般化される可能性もある。

Page 79: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 72 -

費用がますます高騰している医薬品開発の観点から見ると、医薬品の用法用量の決定の

ために、従来の医療統計を用いる治験の方法とは異なり、良い意味での曖昧さを残す方法

を採用することが適切となることも予想できる。

医療や医薬品産業を発展させていくために、勘や経験とは一線を画す、サイエンスに基

づく曖昧さを残すデータ解析について、新たな規制・基準が必要とされるようになるので

はないかと思われた。

【参考文献】

1) 統計遺伝学分野(京都大学) ホームページ:

http://statgenet-kyotouniv.wikidot.com/statistical-analysis-for-genome-based-life-science

Page 80: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 73 -

〔2〕 各種ビッグデータの解析からの新規創薬標的分子の探索や

ドラッグリポジショニングへの活用の現状と今後の課題

ヒアリング先:九州大学 生体防御医学研究所

生体多階層システム研究センター

システムコホート学分野

山西 芳裕 准教授

要約

山西准教授の研究室(以下、山西研)では、医療・医薬関連のビッグデータ及びそのデ

ータベースを活用し、ドラッグリポジショニング、すなわち、既に承認されている薬剤や

過去に医薬品としての開発に失敗した化合物の新しい効能を発見するための機械学習アル

ゴリズム開発が進められている。一つのアプローチとして、薬物応答プロファイル(薬理

作用データ)と疾患プロファイル(分子機序データ)に基づいた薬物・疾患ネットワーク

の予測によるアプローチ、別のアプローチとして、種々の解析手法からの薬物・標的タン

パク質相互作用データと疾患プロファイルに基づいた薬物・標的タンパク質・疾患ネット

ワークの予測によるアプローチが開発されている。薬物・標的タンパク質・疾患ネットワ

ークの解析方法には、ケモゲノミクス法、薬理ゲノミクス法、トランスクリプトミクス法、

の 3 つの方法があり、何れの方法も、複数の薬物・化合物と複数の疾患との間における相

互作用の有無について、網羅的に、かつ一網打尽に捕捉しようとする、機械学習によるデ

ータ駆動型の大量予測法である。使用するデータは、オミックス情報並びに薬物の化学構

造・薬理作用、標的分子の機能やパスウェイ、疾患に関する情報等を網羅する医薬ビッグ

データで、大半は公開されているものである。これまで、山西研手法により予測されたも

ののうち、実験的にリポジショニングの可能性が示されたもの、あるいは文献的にそれが

示唆されるものの例として、骨粗鬆症薬・アレンドロ酸の乳がんへの適用、抗精神病薬の

フェノチアジンの前立腺がんへの適用、などが挙げられる。

1. はじめに

ドラッグリポジショニングという創薬手法が提案されてからかなりの時間が経過してい

るが、これまでは、臨床試験での副作用の所見やランダムスクリーニングでのヒットなど、

偶発的な発見がそのスタートであり、専ら偶然性に支配された、どちらかと言えば科学性

に乏しい手法とも言える。

この創薬アプローチに、医療・医薬ビッグデータを用いたデータ駆動型の科学がどれだ

け貢献できるのかを検証することは、今年度の創薬資源調査班の一つの調査課題である。

しかるに、その方法論についてはまだ確立されたものが有るとは言えず、その実態を複数

のバイオインフォマティクス研究者に伺うこととした。九州大学の山西准教授はゲノム、

トランスクリプトーム、プロテオーム、メタボローム、フェノームなどの網羅的オミック

スデータから様々な分子間相互作用ネットワーク(タンパク質間相互作用、代謝パスウェ

イ、タンパク質リガンド相互作用など)を予測する統計手法を開発しており、その成果を

ドラッグリポジショニングのためのアルゴリズム開発に活用しようと考えている。そこで、

現在の山西研でのこのようなアルゴリズムの開発状況、さらにはこの領域での人工知能技

Page 81: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 74 -

術の将来的な活用の可能性をお聞きすることとした。

2. ドラッグリポジショニングの創薬戦略

ドラッグリポジショニングとは、既に承認されている薬剤や過去に医薬品としての開発

に失敗した化合物の新しい効能を発見して本来とは別の疾患の治療薬として開発していこ

うというアプローチになる。既存薬あるいはある程度開発の進んだ化合物なので、ヒトへ

の安全性や体内動態は確認されているし、製造法もある程度以上は確立されており、高速、

低コスト、低リスクで開発できるというメリットがある。医薬品開発の中盤の工程、場合

によっては Phase I 臨床試験もスキップすることができるので、ヒトでの有効性の検証を

早く行うことができ、より早くより安価により安全な薬を患者に届けることができる。こ

の手法の典型的な成功例として、狭心症治療薬が勃起不全及び肺高血圧の治療薬となった

シルデナフィル、高血圧治療薬が発毛促進薬となったミノキシジルが挙げられる。

過去のドラッグリポジショニングの成功例は、人のひらめきと偶然の発見によるものが

ほとんどなので、より論理的かつ効率的に進める方法を開発することが山西研の大きな目

標である。生命科学の分野で大量に生み出されてきたゲノム、トランスクリプトーム、プ

ロテオーム、メタボロームといったオミックスデータや図 1 に示す医薬ビッグデータを活

用する、科学的根拠に基づく手法の開発が必要であると考えている。

図1.ドラッグリポジショニングに用いる様々な医薬ビッグデータ

(九州大学・山西芳裕氏提供資料)

(1)先行研究

最も有名な先行研究は、アメリカの Broad Institute が作っているデータベースである

Connectivity Map(CMap)の薬物応答遺伝子発現情報を用いた手法である。例えば疾患

特有の遺伝子発現パターンがあった場合に、それと逆相関するような遺伝子発現パターン

をもつような薬物を探索し、疾患による遺伝子発現変動を打ち消すような効果のある薬を

見つけるというのが基本方針である。

このようなアプローチでは細胞の特異性は考慮されておらず、薬物や疾患に基づく遺伝

子発現変動データの質は、その取得条件に大きく依存する。実際に山西研で、そのような

アプローチがどの程度うまくいくのかについて検証した。まず、各種疾患の患者の遺伝子

発現情報をデータベース化し、疾患特有の遺伝子発現プロファイルを構築した。次いで、

Page 82: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 75 -

実際のそれぞれの疾患に対して認可されている薬物を細胞に作用させた時の遺伝子発現プ

ロファイルと比較した。疾患による遺伝子発現変化と薬物による遺伝子発現変化の間の相

関係数を計算し、横軸を疾患のリスト、縦軸を相関係数としてプロットした。逆相関が強

い、すなわち疾患と薬物の作用の間に互いに遺伝子発現を打ち消すような相関(負の値の

相関係数)となる組み合わせが多く出てくるものと期待したが、そのような傾向は強くな

かった。しかし、この手法での成功例も報告されているので、特定の疾患においては有効

な手法であることは否定できない。

(2)山西研での手法

山西研では遺伝子発現情報だけではなく、図1に示すような様々な医薬ビッグデータに

基づくドラッグリポジショニングを提案している。最近の生命科学の進展に伴い、薬剤、

低分子化合物、遺伝子、タンパク質、疾患等に関する様々な膨大なデータが利用可能にな

ってきており、これらのデータをフル活用することが重要と見ている。

また、使用するデータは公開データが多いので、アプローチの独自性を発揮することに

より差別化を図ることにしている。実際のアプローチ法としては、

1) 薬物応答プロファイルと疾患プロファイルに基づく薬物・疾患ネットワークの予

測によるアプローチ

2) 薬物・標的タンパク質相互作用と疾患プロファイルに基づく薬物・標的タンパク

質・疾患ネットワークの予測によるアプローチ

の 2 つをドラッグリポジショニングの山西研手法として用いている。以下、両手法につい

て説明する。

3. 薬物・疾患ネットワークの予測によるアプローチ

(1)目的

この手法の目的としては、薬物又は疾患に関する様々なデータがあった時に、それをう

まく利用して薬物の新規効能を大規模予測する手法を開発するということにある。図 2 に

示すように、多くの薬物、多くの疾患に関しての網羅的データにより、既に知られている

薬物の効果に加え、未知の薬効を一網打尽に予測しようとしている。

図2.薬物・疾患ネットワーク予測の目的

(九州大学・山西芳裕氏提供資料)

Page 83: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 76 -

(2)使用するデータセット

使用するデータセットとしては、薬物の薬理作用のデータと疾患の分子機構に関するデ

ータを用いる(図 3)。前者の薬理作用データは、2,349 個の薬物について患者に投与し

たときのフェノタイプを観察した臨床報告書 300 万件程度を解析して約 14,000 種類の薬

理作用(薬効及び頭痛、気分高揚、眠気あるいは血圧の変化などの副作用)の情報を抽出

したものである。このような情報が各薬物に対して報告されていれば 1、報告されていな

ければ 0 というプロファイルで表現する。

後者の疾患の分子機構に関しては、858 種類の疾患に関して分子機序に関するデータを

準備し、どのような遺伝子やパスウェイ、どのような環境因子がこの疾患に関連している

のか、という情報を収集し、疾患の特徴を上記のようにプロファイル化する。

図3.薬物・疾患ネットワーク予測に用いるデータセット

(九州大学・山西芳裕氏提供資料)

(3)分子機序情報に基づくマッピングによる疾患間の関係

病因遺伝子、異常パスウェイ、環境因子の情報などの分子機序情報に基づいて様々な疾

患を 2 次元にマッピングしたものが図 4 である。近くにあればあるほど病因遺伝子や異常

パスウェイ情報が類似しているということになる。国際疾病分類の ICD-10 のグループ分

けによって色付けをすると、糖尿病とがんが近くにあることが分かる。これは最近、糖尿

病とがんは慢性炎症を通じて相関があるということが指摘されており、それを反映したも

のと思われる。その他にも、喘息やアトピー性皮膚炎及びアレルギー性鼻炎は、病変部位

が異なるにもかかわらず、同じ免疫に関連する疾患として、それぞれ近傍にプロットされ

る。このことは、従来の臓器別の疾患分類ではなく、分子機序に基づく新しい疾患分類の

可能性を示すものである。

Page 84: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 77 -

図4.分子機序情報に基づくマッピングによる疾患間の関係性の表示

(九州大学・山西芳裕氏提供資料)

(4)予測モデルの構築

予測モデルの概要を図 5 に示す。ここでは薬物を X、疾患を Z とし、薬物 X のプロファ

イルを集合としてΦ(X)で、疾患 Z のプロファイルをΦ(Z)として表し、各プロファイル間

のテンソル積をとって薬物Xと疾患 Zのペアの特徴を表す非常に高次元のプロファイルΦ

(X,Z)を構築する。次いで、この薬物と疾患のペアの関連の有無を分類するモデルを構築し

て、L1 正則化に基づくロジスティック回帰分析による学習を行う。

図5.薬物・疾患ネットワーク予測モデルの構築

(九州大学・山西芳裕氏提供資料)

(5)予測モデルの性能評価

ベンチマーク的なデータを用いて山西研モデルの評価を行うことができる(図 6)。疾

患(323 種類)とその疾患に対する既知薬物(694 種類)の関連を示す、すなわち薬効に

関する 1,432 種類のペアデータをベンチマークデータとしてブラインド化し、ブラインド

化されたデータが、山西研手法を用いて再現できるかについて、予測精度の評価を ROC

Page 85: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 78 -

(Receiver Operating Characteristic)カーブを用いて行った。その結果、山西研手法は

ランダムな予測よりも有意に高い精度であった。なお、図 7 の縦軸は True Positive、つま

り予測が当たった割合、横軸は False Positive、つまり予測が外れた割合を表す。また、

類似の手法として PREDICT1)及び PreDR2)といった手法があるが、同じデータを用い

て彼らの手法との比較を ROC カーブの AUC(カーブの下の面積)を指標に行った場合、

山西研手法の予測精度の方が上回ることを確認できている。

図6.薬物・疾患ネットワーク予測モデルの性能評価

(九州大学・山西芳裕氏提供資料)

(6)新規予測

日本や欧米で承認されている約 2,300 の薬物及びがん、神経変性疾患など約 800 の疾患

について、約 200 万のすべての薬物・疾患ペアに対して、山西研手法を適用し新規予測を

行った。その結果、約 12 万ペアにも達する薬物・疾患ペアにおいて効能があるのではな

いかという予測ができた。実際、そのような予測がそれぞれの疾患グループに対してどの

ように分布しているかをプロットしたものが図 7 である。一つ一つのノードは国際疾病分

類 ICD10 のグループに相当し、ノード間を連結する線(エッジ)の太さは異なる疾患グ

ループ間でリポジショニングされた薬物の数を示す。多岐にわたる疾患グループ間でのリ

ポジショニングの可能性が示されている。

一例として、もともとは骨粗鬆症薬のアレンドロ酸が乳がんに有効であるなど、抗がん

効果が予測される幾つかの既承認薬が見出された3)。予測スコアの高いものについては、

近年の多くの文献や臨床報告でその可能性が示唆されていることが確認できている。

Page 86: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 79 -

図7.薬物・疾患ネットワーク予測モデルによる薬物と疾患の関連付け

(九州大学・山西芳裕氏提供資料)

(7) 化学構造への依存度

薬物・疾患ペアに基づく予測が、薬物の化学構造の多様性にどの程度関係しているのか

について検証を行った。化学構造の類似性ですべての薬物をあらかじめクラスタリングし、

各クラスターから代表薬物を一つだけ選択する。その際、クラスタリングの閾値を変える

ことにより、化学構造の多様性の異なる複数の薬物のセットを作成し、各薬物セットに対

して予測を行った。横軸に化学構造の多様性を、縦軸に予測精度(ROCカーブのAUC)を

プロットすると、予測精度(性能)は化学構造類似性とは関係がないことが分かった。

山西研手法は、様々な疾患に対する既存薬物の新規効能を予測可能であるということを

示すものである。薬理作用のフェノタイプの情報を用いることにより、化学構造の類似性

にとらわれない新たな効能予測が可能であるということが示された。

4. 薬物・標的タンパク質・疾患ネットワークの予測によるアプローチ

(1)目的

上記の薬物・疾患ペアに基づく予測の限界は、その薬物の作用機序に関する情報を明ら

かにできないところである。その点を克服できる予測手法が構築できないかということか

ら、薬物・標的タンパク質相互作用と疾患プロファイルからの薬物・標的タンパク質・疾

患ネットワークの予測に基づく、第2のリポジショニングのアプローチが進められている。

薬物が数千個あり、タンパク質も数万個もある、疾患も数千種類というオーダーで存在

する空間で、3者間の未知の関係性を、医薬ビッグデータと機械学習を使って一網打尽に

予測しようとしている。標的タンパク質まで示唆できれば、適応可能疾患に加えて、作用

機序までを含む情報を予測できると考えられる(図8)。

このアプローチでは、それぞれケモゲノミクス法、薬理ゲノミクス法及びトランスクリ

プトミクス法と名付けられた3つの手法を使い分けている。

Page 87: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 80 -

図8.薬物・標的タンパク質・疾患ネットワーク予測の目的

(九州大学・山西芳裕氏提供資料)

(2)ケモゲノミクス法

既存のインシリコ手法には、ある特定の標的タンパク質の立体構造をもとにドッキング

スタディーを行い、結合ポケットに相補的に結合する薬物を選択するアプローチと、既知

リガンドの情報(化学構造や構造活性相関)を学習して、知りたい薬物との相互作用を予

測するアプローチの2通りがある。いずれの方法もひとつのタンパク質に注目して、それ

に対する薬物の相互作用の有無を予測するものである。

山西研のケモゲノミクス法は、化学構造が似ている薬物(化合物)は同じようなタンパ

ク質と相互作用するとの前提を基に予測を進める手法である。単一の標的タンパク質に限

定せずに、複数の標的タンパク質を扱えるように拡張したものであり、複数の標的タンパ

ク質間の相互作用も考慮することが可能である。

この手法の基本的概念はタンパク質と既知薬物のペアに対して、相互作用ペアと非相互

作用ペアに分離出来るようなモデルを構築することにある。最初に、相互作用パートナー

が既知化合物とタンパク質を多次元の特徴空間(Interaction space)にマッピングし、次

いで、統計的な機械学習によりInteraction spaceとChemical space及びGenomic spaceの

相関モデルを構築する。最後に、相互作用を知りたい薬物及びタンパク質ペアに対して相

関モデルを適用し、Interaction spaceにマッピングすることにより新規な相互作用を予測

する。以上のようなアルゴリズムを山西研では構築、実用化を試みている(図9)。

このアルゴリズムを、他のグループの競合技術と前述の評価法(ROCカーブのAUCによ

る)により比較したところ、精度は同等かそれ以上、また、計算時間が圧倒的に短くなる

ということが確認できた。

Page 88: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 81 -

図9. ケモゲノミクス法による予測手法

(九州大学・山西芳裕氏提供資料)

(3)薬理ゲノミクス法

薬理ゲノミクス法の基本的な方針は、副作用も含めて薬理作用が似ている薬物は同じよ

うなタンパク質に相互作用するだろうという前提の下に予測を進めることにある。5,477

の薬物について、患者に投与したときに、人体に及ぼす様々なフェノタイプをデータセッ

トとして用いる。薬物を患者に投与したときの人体のフェノタイプの変化(例えば、眠気、

気分高揚、血圧の変化、疾患マーカーの変動など)を記した臨床報告書(約 300 万件)を

解析した。報告書から約 1 万種類の薬理作用の情報を抽出し、それらの反応が各薬物に対

して過去に何回報告されたかという情報も加味して、薬物間の薬理作用の類似性を評価し

た。その結果、薬理作用の類似性は化学構造の類似性とは必ずしも相関しないことが分か

った。

ケモゲノミクス法では、予測対象の薬物と類似構造の薬物が学習データに多く含まれる

場合には良い予測精度を示すが、構造が似ていない薬物だけが学習データに含まれると予

測精度は大きく低下する。一方、薬理ゲノミクスの手法では、薬物の多様性の大小に関わ

らず、ある程度の精度を維持できているということが分かった。化学構造から推定できな

いような、タンパク質と薬物間のミッシングリンクが検出可能と考えられた(図 10)。つ

まり、2 つの方法は相補的な関係にあると考えられた。

Page 89: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 82 -

図10. 薬理ゲノミクス法による予測手法

(九州大学・山西芳裕氏提供資料)

(4)トランスクリプトミクス法

トランスクリプトミクス法の基本は、細胞の薬物応答の遺伝子発現パターンが似ている

薬物は同じようなタンパク質に相互作用するだろうという前提の下に予測を進めることに

ある。薬物が作用するパスウェイレベルでの作用機序が推定できるというのが特徴である。

細胞に薬物を作用させる前後の遺伝子発現比をデータセットとして用い、遺伝子発現プ

ロファイルを構築し薬物間の遺伝子発現の類似性を評価した。薬物による遺伝子発現変動

情報については、前述の解析で用いた CMap ではなく、2014 年にリリースされた、LINCS

(Library of Integrated Network-based Cellular Signature)4)という CMap の後継プ

ロジェクトのデータベースを用いた。LINCS は、パネルアッセイでの遺伝子発現データで

あり、対象となる遺伝子に網羅性はないが、CMap に比べ圧倒的に化合物及び細胞の種類

が多く、細胞特異的な応答比較に向いている(図 11)。

図11. トランスクリプトミクス法による予測手法

(九州大学・山西芳裕氏提供資料)

Page 90: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 83 -

遺伝子発現プロファイルにおいて発現が増加する遺伝子、減少する遺伝子をパスウェイ

マップ解析することで、どのパスウェイが活性化又は不活性化されているかを見ることが

できる。パスウェイのリストと薬物の既存の薬効分類(ATC code)の間で相関を見ると、

例えば抗がん剤に分類される薬物群はセルサイクルのパスウェイ上の遺伝子群を不活化し、

p53 のパスウェイを活性化するということが確認できる。

この予測モデルの性能評価を前述のモデルと同様に行ったところ、薬理ゲノミクスの手

法と同様の傾向、すなわち、薬物の化学構造には依存せずに精度の高い予測ができるとい

うことが示唆された。

(5)薬物・標的タンパク質・疾患ネットワークの予測からのドラッグリポジショニング

実施例

日欧米で承認されている約 8,000 個の薬剤に対して 3 つの手法を用いて標的タンパク質

と適応可能疾患の推定を行った。標的タンパク質の候補としては、創薬標的として望まし

いと考えられる、酵素、GPCR、イオンチャネル及び核内受容体のファミリーに焦点を当

てた。疾患に関しては、がん、神経変性疾患及び免疫系疾患など、約 1,300 の疾患に対す

る効能を予測した。

最初に標的タンパク質(オフターゲットを含める)の予測を行い、もともとの既知標的

タンパク質と今回予測された新規標的タンパク質を元に適応可能疾患の予測を行った。薬

物、標的タンパク質、適用可能疾患の 3者の相関が明らかになり、約 6,500 の薬物が約 1,100

の疾患と関連付けられ、約 20 万ペアの薬物と疾患の組み合わせが予測できた。

2 型糖尿病薬のピオグリタゾン(Pioglitazone)のケースは、ケモゲノミクス法により、

monoamine oxidase B (MAOB)というタンパク質との相互作用が予測されたため、パ

ーキンソン病に効くのではないかと考えられる例である。MAOB はドーパミン分解酵素、

つまりその分解を阻害剤で抑えることで効能につながると考えられる。次に、学習データ

に入っている化合物群で MAOB と相互作用することが既知の化合物は、非常にピオグリ

タゾンと化学構造が似ていた。すなわち、化学構造に依存するというこの手法の特徴が出

た例である。

薬理ゲノミクスによる予測の例では、抗うつ剤のパロキセチン(Paroxetine)がイオン

チャネル型 ATP 受容体(P2X4)というタンパク質に対する相互作用が予測され、神経障

害性疼痛への適用が考えられた。P2X4 を疼痛のターゲットとして世界で最初に同定した、

九州大学薬学研究院の井上和英教授らのグループは、P2X4受容体アンタゴニストが P2X4

と相互作用し、実際にパロキセチンが痛みを和らげるということを確認している5)。それ

を再現する結果であることを示している。

トランスクリプトミクス法を用いた例では、抗精神病薬のフェノチアジン

(Phenothiazine)が、アンドロゲンの受容体(AR)に対して相互作用すると予測された

ので、前立腺がんにも効くのではないかと考えられた。遺伝子発現パターンが学習データ

の中で一番似ていたのがエンザルタミド(Enzalutamide)という薬物であったが、こちら

は前立腺がん治療薬であり、アンドロゲン受容体(AR)の発現が亢進している前立腺がん

細胞でアポトーシスを誘導することが既に知られている。実際に山西研でのパスウェイ解

析でもアポトーシス活性のあることが予測できた。また、フェノチアジンでもアポトーシ

Page 91: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 84 -

ス活性を予測できたので、同じようなメカニズムで前立腺がんに奏功することが期待され

た。AR に対する阻害効果を実験的に確認したところ、IC50=3.6µM の阻害活性が認められ

た。

図 12 は 3 つの方法で関連性が予測された、薬物と疾患の約 20 万ペアのリポジショニン

グの分布を予測方法別に纏めたものである。図 8 と同様な表示になっているが、方法によ

り、そのパターンが異なることが分かる。使用するデータと方法の違いにより、予測結果

が異なるので、3 つの手法がそれぞれ補完的に使用できると考えられた。

図12.薬物・標的タンパク質・疾患ネットワーク予測モデルによる

薬物と疾患の関連付け (九州大学・山西芳裕氏提供資料)

5. 今後の展望と課題

今回紹介された方法により、多くの既存薬物・化合物に対して新規の適応疾患及び潜在

的な標的タンパク質を網羅的に推定することが可能であることが示された。後者には、オ

フターゲットのタンパク質の推定も含まれる。また、複数のデータセットや手法を組み合

わせて用いることにより、結果を補完し合うことも可能と思われ、網羅性が更に高まる。

また、新規に推定された標的たんぱく質のプロファイルが明らかになれば、既存薬の様々

な疾患に対する新しい効能の発見の可能性が飛躍的に大きくなる。

山西研では実験室での化学操作は全く実施しない。予測上位にあるものが必ずしも生物

学的に真実とは限らないが、その可能性をより効率良く提供するのが、インフォマティク

スといったものである。したがって、予測された結果を目利きできる研究者は必要であり、

予測結果を確かめるためには実験系研究者や臨床系研究者との共同研究が不可欠である。

積極的に共同研究を進めており、大学病院で臨床試験まで進んでいる事例もある。また、

製薬企業数社とも共同研究を行っている。

山西研で利用しているデータは、公的データベースが中心で、海外に由来したものも使

Page 92: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 85 -

用している。このようなデータベースは、どの情報科学者でもアクセス可能であり、同じ

手法であれば、海外の研究グループの方が早期に成果を出すであろう。そのため、より高

精度でかつ独創的な解析手法を、海外のグループより早く見出すことが重要であり、山西

研の目指しているところであると言える。

使用するデータの質は当然ながら、予測精度に及ぼす影響が大きい。現状では、薬物・

化合物の阻害活性の有無について閾値(IC50値)を何処に設定するかについては統一した

基準値を設けて対応している。副作用情報等については判定する臨床医の記述、使用用語

を採用するしか方法が無く、用語の統一を進める必要性は大きい。特に、臨床情報やレセ

プト情報が重要であるが、現状では、統一された表記法が無く、使用される語彙も統一さ

れていないので使用が難しい。また、より根本的な問題として、法制上、基礎研究の研究

者がこれらのデータにアクセスする道が閉ざされているという現実がある。

医療・医薬ビッグデータからドラッグリポジショニングでの新規適用疾患の予測の過程

への AI の活用に関しては、AI の基盤技術である機械学習自体、単純な問題設定でのアル

ゴリズムの性能の方がほぼ臨界状態まで来ている。それよりも、データの質的・量的な整

備が非常に重要であり、今後のブレークスルーになってくるであろう。データの大量導入

時や選別に関しては、AI によるテキストマイニング技術を開発し活用する価値はある。

ドラッグリポジショニングの手法を化合物のみならず、食品や健康食品等にも適用、新

たな予防・先制医療の道を開拓することも可能である。既に、漢方薬・生薬の有効成分に

対しての標的タンパク質の予測から新規適応可能性疾患の予測を狙い、富山大学和漢医薬

学総合研究所との共同研究が始められている。

6. 執筆担当者所感

創薬手法としてのドラッグリポジショニングについては、製薬企業としては開発中の薬

剤の適用拡大時に単発的に取り組む程度で、ゼロベースでは取り組みにくいアプローチで

ある。むしろ、アカデミアでの研究対象となっている観がある。このことは、リポジショ

ニングされた薬剤について、特許上の保護が容易ではないこと、保護ができたとしても市

場独占性の維持は実質的には難しいことなどと無関係ではない。それに加え、国内の薬価

制度は、リポジショニング薬剤をことさら優遇するものでもない。これらのことが、製薬

企業がリポジショニングに対して二の足を踏む大きな理由である。

ゼロベースでリポジショニングに取り組むならば、一つ一つの化合物について実験を重

ねて新規の薬理活性の発見を狙うというのはもはや時代遅れであり、まずは山西研のよう

に網羅的にインシリコで適用疾患を予測するということになる。その際、現在、使用可能

なデータが、ビッグデータとは言え、量的なものはともかく質的に使用可能かどうか、ま

た、質的に低水準でも使用するアルゴリズムの性能でカバーできるのかというところが今

回の大きな調査課題であった。このヒアリングで得た感触は、現在のデータの質の面は十

分でない、しかし、解析アルゴリズムの性能を上げれば幾分かは代償可能ということにな

る。

リポジショニングの成果を飛躍的に上げるためには、やはり、使用するデータの質、特

に臨床情報の質が重要である。他のヒアリングにおいても、臨床情報の電子化やデータベ

ース化にはそれなりの注力が為されてはいるものの、基礎レベルの研究者が自由に使える

Page 93: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 86 -

ようになるまでは、まだまだ長い時間と紆余曲折が必要と思われ、海外との競合を考える

と、別のアプローチを考えるべき時期であると思われる。特に創薬あるいは薬物療法に特

化した質の高いデータの収集とデータベースの構築が必要である。例えば、製薬企業で放

置されている、開発失敗化合物も含めた前臨床や臨床試験での薬効・安全性データの収集、

あるいは、既存のコホート研究との連携による投薬に関連するデータの収集が有効ではな

いかと思われる。また、データの選択には目利きの人材が必要で、製薬企業で長年、薬理

研究に従事した研究者に委託するというのも一考の価値が有ると思われる。

参考 文献

1) Gottlieb et al., Mol.Syst.Biol. 2011

2) Wang et al., PLos One. 2013)

3) Iwata et al., J Chem Inf Model 55(2) 446-459, 2015

4) BD2K-LINCS DATA CORDINATION AND INTEGRATION CENTER ホームペ

ージ http://lincs-dcic.org/

5) 日本医療研究開発機構ホームページ プレスリリース 2016 年 6 月 17 日

http://www.amed.go.jp/news/release_20160617.html

Page 94: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 87 -

〔3〕 オミックスデータを活用する創薬の IT ブースティング

ヒアリング先:

国立研究開発法人 産業技術総合研究所

創薬分子プロファイリング研究センター

堀本 勝久 副研究センター長

要約

近年の計測技術の進歩に伴い、網羅的なオミックスデータが創出されるようになり、IT

技術による解析を取り入れたシステム生物学という概念が生まれた。システム生物学にお

いても、「仮説を立て、ゴールを設定してデータを集め、検証を積み重ねていくことが新た

な発見に結びつく」というコンセプトに基づき、研究開始時に明確なゴールを設定し、ゴ

ールに至るまでの戦略が重要であることを、三つのドラッグリポジショニングの事例を使

って紹介頂いた。

一番目の事例は、抗がん剤が効かなくなる前立腺がんを効くように戻すのに、C 型肝炎

薬の Rivabirin の併用が有効であることを発見したという研究成果である。抗がん剤感受

性がん細胞と耐性がん細胞との比較と、薬剤により影響を受け変動する分子群を解析する

Connectivity Map (c-map)1)の手法を応用して、併用薬を絞り込んだ。この併用療法

の有効性を確認するため、現在医師主導臨床試験が行われている。二番目の事例は、

Paclitaxel 耐性の乳がんに効果のある薬剤探索を同様の手法に加え独自技術によって行っ

た研究である。最初に Paclitaxel 感受性細胞株と耐性細胞株との比較を行い、次に、薬剤

を作用させることにより変動する分子群を解析することで、複数の候補を発見した。現在

は動物実験の段階であるが、さらなる成果が見込まれる。三番目の事例は、現在注力して

いる希少疾患を適応症とした薬剤開発である。

また、ドラッグリポジショニングの手法は二つの方向への拡張が可能なことも議論した。

一つは、疾患に有効な試薬等を承認薬で置き換えることのできる可能性であり、もう一つ

は、疾患から化合物を推定するドラッグリポジショニングの逆問題として、化合物から疾

患を推定することの可能性である。既に実証解析が行われており、実現可能性が極めて高

い。

さらに、患者層別化マーカー(バイオマーカー)開発などの分野でも成果が出ており、

保有する Compound Eyes、Cyber Drug Discovery、Drug Saver の三つの数理情報解析ツ

ールを活用した創薬の IT ブースティング(数理情報技術の活用による創薬プロセスの加

速)事業の発展が期待される。

1. はじめに

堀本副研究センター長は、計算システム生物学的解析法を用いた創薬研究に精力的に取

り組まれており、「ビッグデータを利用した創薬」、「オミックスデータのシステム数理情報

解析」等の著作がある2),3)。

現在、産業技術総合研究所 創薬分子プロファイリング研究センター(以下、「molprof」)

では、2015 年に新たに中期 5 カ年計画が施行され、創薬研究においては研究成果の事業

Page 95: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 88 -

化までをも意識した目標設定がなされることとなった。このような環境下で研究を進める

堀本副研究センター長から、今回は創薬のためのオミックスデータの活用、ドラッグリポ

ジショニング及び創薬の IT ブースティングに関する内容を中心にお話を伺った。本稿に

おいては、講演内容及び創薬資源調査班員との討論の抜粋を記すこととした。

2.オミックスデータと計算システム生物学

(1)分子生物学からシステム生物学へ

1953 年にワトソンとクリックにより DNA の二重らせん構造が発表されて以降、分子レ

ベルの生物学の研究が盛んに行われるようになり、分子生物学は発展を遂げた。その後、

計測技術が進歩し、今日ではセントラク・ドグマに沿った各段階で細胞内のほとんどすべ

て分子のデータ(オミックスデータ)を網羅的に短時間で測定できるようになってきてい

る。その結果、実験から得られるデータ量は膨大となり、数理科学とコンピュータを駆使

したデータ解析が行われるようになると、生命を一つのシステムとして捉え、生命現象を

システム内の分子間の関係性の変化と考えるシステム生物学が生まれた。近年、システム

生物学の考え方を創薬に応用する試みが様々な研究者によって行われている(図 1)。

ただし、分子生物学と同様、目に見えない分子を扱うシステム生物学においても、仮説

を立て、それを立証することを目的としてデータを集め、検証を積み重ねていくことが新

たな発見に結びつくというコンセプトに変わりはない。先生は、「最も大切なことは、研究

開始時のゴール設定と、ゴールに到達するためのデータの集め方及び解析方法などの確か

な戦略の立案にある」ということを強調された。

図1.分子生物学からシステム生物学へ

(産業技術総合研究所・堀本勝久氏提供資料)

(2)計算システム生物学における二つのアプローチ

計算システム生物学には、モデル駆動型とデータ駆動型の二つのアプローチ方法が存在

する(図 2)。

モデル駆動型においては、代謝経路やシグナル伝達経路の分子間相互作用に関する知識

情報に基づいて事前にモデルを想定し、相互作用それぞれの素過程を考慮した微分方程式

系を作成する。変数間のパラーメーター値も文献情報から設定し、微分方程式系の解につ

Page 96: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 89 -

いて計算機実験(シミュレーション)を行う。それぞれの分子の量の動的な振る舞いを再

現することで、新しい知見の発見を目指す。ただし、新規な相互作用の発見はなく、検証

的な研究が主となる。

一方、データ駆動型は、得られている計測データから新規の分子間相互作用を推定する

探索的な研究である。この際、様々なネットワーク解析の数理モデルが活用される。この

方法の技術的基盤は、昨今の計測技術のめざましい進歩による網羅的オミックスデータの

蓄積、そして数理統計学やコンピュータの利用にあることは言うまでもない。網羅的なオ

ミックスデータにより、分子の量は計測可能になった。この量に基づいて、分子の因果関

係(相互作用)を推定することを目指している。

図2.計算システム生物学における二つのアプローチ

(産業技術総合研究所・堀本勝久氏提供資料)

ここで注意すべきは、数理解析のソフトウェアの入手は容易なものとなっていることで

ある。例えば、フリーソフトウェア「R」には、非常に多くの数理ソフトウェアが含まれ

る4)。誰でも計測データに基づいて解析自体は可能である。ただし、多くの測定データと

解析ソフトウェアがあれば新しい発見ができるというものではない。多くのデータの中か

ら重要なものを見極め、重要でない部分を排除して、少なくとも量的に実験検証できるレ

ベルにまで、創薬や疾患のバイオマーカーもしくは創薬標的の候補分子を絞り込むところ

に、科学者の目利きの力量が問われる。

(3)創薬における数理科学応用の二つの流れ

創薬における数理科学の応用においては、化合物の物理・化学的性質に注目する「化合

物構造の考え方」と、化合物による細胞内分子群の変化に着目する「システム薬理学の考

え方」に基づく二つの流れがある。

前者は、一化合物一標的分子の仮説に基づき、標的タンパク質の結晶構造を明らかにし、

その標的タンパク質に生体物質に類似した化合物構造が結合するように、数理科学手法に

よりデザインすることで創薬に結びつける考え方である。

後者は、細胞内にある数万の分子群の変化に着目し、薬剤投与前後での多数の分子の変

変動のパターンを調べることを基本とする考え方である。疾患によって引き起こされる細

胞内分子群の変動と化合物投与によって引き起こされる変動に着目して、同じような変動

を起こす化合物、あるいは疾患による変動をキャンセルするような変動パターンを示す化

合物を探すことによって創薬に結びつける「細胞状態ミミック」という考え方である(図

3)。molprof の堀本グループでは、この考え方に基づいて、様々な創薬解析を行っている。

Page 97: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 90 -

図3.創薬における数理科学の応用の二つの流れ

(産業技術総合研究所・堀本勝久氏提供資料)

細胞状態ミミックのアプローチの代表的な例として、”Connectivity Map”(c-map)

がある(図 4)4)。c-map では、約 1,300 の FDA 承認薬を、数種の細胞株に複数濃度で作

用させた前後の遺伝子発現の変動パターンが収納されている。さらに、ユーザーが自らの

化合物について投与前後で変動する特徴的な遺伝子群(遺伝子刻印)を照会すると、収納

された遺伝子発現パターンの中から発現パターンが類似している承認薬を特定でき、ある

疾患の遺伝子刻印を照会すると、疾患の遺伝子発現をキャンセルするような承認薬が特定

できるソフトウェアシステムが装備されている。この手法を用いたドラッグリポジショニ

ングの事例を紹介する。

図4.Connectivity Map

(産業技術総合研究所・堀本勝久氏提供資料)

3. molprofにおけるドラッグリポジショニング

(1)Drug Efficacy Reprogramming

慶應大学病院の泌尿器科から、「前立腺がんのホルモン療法において治療薬が効かなくな

Page 98: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 91 -

るのだが、分子レベルで説明できないか」という課題を提起された。堀本グループにおい

ては、がん細胞と正常細胞において遺伝子発現を比較した経験があったが、5,000 から

10,000 程度の遺伝子発現が変動し、これらの中からがんに一義的に関係する遺伝子群を絞

り込むのは困難と考えられた。しかし、その時とは異なり、この課題で比較するのはがん

細胞同士でありながら、薬剤耐性と薬剤感受性の細胞の遺伝子発現を比較するので、課題

の特徴的遺伝子群を絞り込むことのできる可能性が高いと考えられた。そこで、薬剤耐性

と薬剤感受性の細胞の特徴的遺伝子群を推定し、c-map の手法を応用して薬剤耐性細胞を

薬剤感受性細胞に変化させる承認薬の探索を実施した。抗がん剤において薬剤耐性と薬剤

感受性の細胞間の相異、すなわち悪性度の高さの相異は、がんの幹細胞性によると考えら

れている。そこで、探索する薬剤は、細胞の性質を薬剤耐性から薬剤感受性(良性)に変

化させる薬剤、細胞の幹細胞性をキャンセルさせる薬剤であることから、薬剤耐性と薬剤

感受性の細胞種のデータ→遺伝子刻印推定→細胞状態ミミックアプローチによる承認薬探

索、という一連の汎用ワークフローを Drug Efficacy Reprogramming(DER)と名付け

た(図 5)。

図5.Drug efficacy Reprogramming の概念

(産業技術総合研究所・堀本勝久氏提供資料)

実際に、薬剤(ホルモン剤及び Docetaxel)耐性前立腺がん細胞と感受性細胞について

注意深く細胞種を分別し、その遺伝子発現を測定・比較したところ、約 750 の遺伝子から

なる遺伝子刻印が得られた。これらの遺伝子群から c-map を用いた推定により、治療薬候

補が 9化合物に絞り込まれ、細胞株及び動物実験により最終的な候補薬剤として Rivabirin

が見出された(図 6)。

Page 99: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 92 -

図6 Drug efficacy Reprogramming-絞込み例

(産業技術総合研究所・堀本勝久氏提供資料)

Rivabirin は C 型肝炎ウイルスに対する抗ウイルス薬であり、これを悪性前立腺がんの

治療に転用するという典型的なドラッグリポジショニングである。この事例は DER の有

効性を示す一例である。この発見は、疾患と薬剤の種類に拠らず耐性と感受性の細胞に関

して適用できるプラットフォーム型創薬であり、そのコアの技術が数理解析であることか

ら注目を集めた(図 7)。なお、Rivabirin については、慶應義塾大学において医師主導治

験が実施されている。

図7.Drug Efficacy Reprogramming で見出された Rivabirin の医師主導治験

(産業技術総合研究所・堀本勝久氏提供資料)

(2)Cyber Drug Discovery

c-map では、遺伝子変動量の相異に基づいて発現パターンの類似もしくは逆パターンを

示す承認薬を推定する。堀本グループでは、ネットワーク解析手法開発の経験を生かして、

相関に基づいて承認薬を推定するシステムを開発した。疾患又はある特定の病態時におけ

る細胞内分子群の変化と承認薬投与前後の細胞内分子群変化の情報の相関を推定し、疾患

Page 100: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 93 -

時の細胞内分子に対して逆相関を示す化合物群を見出すことができれば、それらはドラッ

グリポジショニングの開発薬候補となる(図 8)。

図8.Cyber Drug Discovery

(産業技術総合研究所・堀本勝久氏提供資料)

この手法を応用した例としては、Paclitaxel 耐性乳がんに対するドラッグリポジショニ

ングと、希少疾患へのドラッグリポジショニングが挙げられる。

図 9 は Paclitaxel 耐性乳がんに対する効果のある薬剤探索の例である。Cyber Drug

Discovery の手法を適用して抗がん剤以外の薬剤を探索すると三つの候補が見出され、異

種移植モデルでの評価により二つの候補薬剤に絞り込まれた。

図9.Paclitaxel 耐性の乳がんに効果のある薬剤探索

(産業技術総合研究所・堀本勝久氏提供資料)

Cyber Drug Discovery の手法は、希少疾患のように薬を見出すのが容易ではない疾患に

適している。希少疾患では様々な病態・症状が見られるが、それらの一つに注目すれば、

一般的な疾患にも繋がるところがある。例えば、ある希少疾患に見られる骨病変は、一般

Page 101: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 94 -

的な疾患である骨粗鬆症と分子的病因を共通とするかもしれない。そのような観点から、

堀本グループでは、希少疾患に転用できる既存薬若しくは代表化合物を見つけることを主

目的とすると同時に、その先にある一般的疾患への適応拡大も視野に入れて承認薬の選別

が行われている(図 10)。

図10.希少疾患に対するドラッグリポジショニング

(産業技術総合研究所・堀本勝久氏提供資料)

(3)今後のドラッグリポジショニング及びその技術の適用拡大計画

堀本グループでは、化合物の細胞内分子群変動から既存薬を探索する他に、ニつの細胞

内変動ミミックのアプローチの適用を行っている。

一つは、試薬としての阻害剤(タンパク質阻害剤や siRNA など)と同等な作用が期待

できる承認薬の探索である。阻害剤によって細胞株など実験研究で明確な作用が確認され

た場合、それと同様な作用を示す承認薬で置き換えることができれば、個体への作用の期

待が高まる。

もう一つは、疾患時の細胞内分子群の変化の情報からその疾患に適した化合物を探索す

る逆問題として、化合物(例えば、新規な化合物や企業の開発中止化合物)による細胞内

分子群の変化から、その化合物が適用可能な疾患の探索である(図 11)。新規化合物に関

しては、実験による表現型スクリーニングの結果を、分子レベルで検証できるだけでなく、

その薬効機序解明も併せて行うことができる。また、企業の開発中止化合物や特許切れが

近づいた承認薬に関しては、化合物の適用疾患の推定は、企業のもつ化合物資産の最大化

につながる。

Page 102: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 95 -

図11.ドラッグレスキュー

(産業技術総合研究所・堀本勝久氏提供資料)

4. 創薬 IT ブースティング

堀本グループでは、Compound Eyes、Cyber Drug Discovery、Drug Saver の三つの数

理情報解析ツールを保有している(図 12)。

Compound Eyes は、オミックスデータをもとに薬効機序解明のための基礎的な解析を

行う。独自技術として、表現型の特徴を最大限に反映させた形で分子刻印を推定する技術

と、特異的条件下(例えばある化合物を投与した場合)で計測されたデータに基づいて、

その条件下で活性化しているパスウェイを探索する「ネットワークスクリーニング」が搭

載されている。

Cyber Drug Discovery は、上記ドラッグリポジショニングと新規適用疾患の探索を行う

ツールである。特に、ネットワーク解析による変動相関から探索を行う技術は独自のもの

であり、従来の変動量のみの探索を補填するものとなっている。

Drug Saver は、マーカー探索ツールである。薬効や診断結果など(目的変数)に直接

的関与する臨床データや分子データ(説明変数)の選別を行う技術を搭載し、特に予測の

際常に問題となる過剰適合(overfitting)を抑制することができ、前向きのデータに極め

て頑強なマーカーの探索が可能になっている。

これらのツールは、すべての創薬プロセスをカバーしているため、どの段階からでも製

薬企業と共同で創薬に取り組むことが可能となる。そして、すべてのツールにおいて解析

結果が個体に届くことを目的として設定されているため、各段階で創薬プロセスの加速(コ

スト削減)に寄与すること(IT ブースティング)が見込まれる。

Page 103: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 96 -

図12.TetraD による創薬 IT ブースティング

(産業技術総合研究所・堀本勝久氏提供資料)

5. 創薬への人工知能(AI)応用の可能性

厚生労働省は平成 29 年度の概算要求の中で、「AI の創薬研究への応用」を項目としてあ

げている。国内製薬企業の中には、IBM の Watson を利用した創薬に取り組んでいるとこ

ろもあり、近年、創薬における AI の活用が注目されている。創薬研究に AI をどのように

使えばよいかに、今のところ正解は見あたらない。創薬への AI の応用の可能性について

堀本副研究センター長と創薬資源調査班員とで討論した。以下はその抜粋である。

創薬目的で AI を使用する場合の課題として、以下のような点があげられる。AI が機械

学習を行うためには、ユーザーが正例と負例を定義しなければならない。定義によって結

果が変わるが、生物現象の時間的環境的ダイナミズムを考えれば、正例と負例を二項対立

的に分類することは難しいのではないか。

AI の学習に用いるデータの質は重要である。実験データは取得条件により変わるので、

単にデータを数多く集めればよいというわけではない。重要なのは、しっかりと決めた前

提及び合意設定をした上で、正確な計測を実施していくことである。もちろん、計測が正

確であれば、データ数が多いほどよいのは間違いない。それが担保されていない単純なビ

ッグデータで機械学習を実施しても、正例を定義しにくい。その上、AI の学習に用いるデ

ータ自体が、人間が選んだバイアスがかかったものである。そのようにバイアスがかかっ

たデータを未知のものに拡大して適応できるかどうかについては、疑問は残る。

さらに、AI が導出した結果の取り扱い方を最終的に判断するのは人間である。AI が予

想外の結果を出した時に、人間がその妥当性を判定して、それをヒトに応用することの是

非を判断しなければならない。どのような方法でそれを行っていくかについては、今後の

議論が必要であろう。

AI は、うまく使いこなすことができれば非常に有用な創薬ツールになることが予想され

るが、現時点ではまだ課題も多く使い方が難しいと考えられる。

Page 104: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 97 -

6. 執筆担当者所感

近年の科学技術の進歩はめざましく、今日では細胞内で起こる様々な変化を短時間で測

定できるようになってきている。それに伴い、研究で得られるデータ量は膨大になり、コ

ンピュータを駆使したデータ解析が欠かせなくなっている。また、将来的には、AI を用い

たデータ解析による新たな発見も実現するかもしれない。ただし、そのような状況になっ

たとしても、実験をデザインしてデータを取得するのも、AI に学習させるデータを選ぶの

も、AI が出した結論を活用するのも人間である。どのようなサンプルをどのタイミングで

どのように得るか、得られたサンプルをどのように処理するかといったデザインの違いが

得られるデータの違いにつながり、学習させるデータの違いが得られる結果の違いにつな

がる。また、AI が従来の科学の常識とはかけ離れた結論を出した場合に、人間がその真否

を判断して結果を活用しなければならない。技術の進歩は喜ばしいことではあるが、人間

がそれを使いこなして正確な結果を出し、結果の利用に当たっては正確な判断ができるよ

うになる必要がある。技術革新と同様、あるいはそれ以上に、使いこなせる人材の育成が

重要であると考える。

また、製薬企業が目指すドラッグリポジショニングでは、多くの場合、自社化合物につ

いて、最初の想定とは異なる適応症を見出して開発することを目的としている。目的の中

心は、自社資源の有効活用・自社化合物の価値の最大化にある。これに対して、アカデミ

アが目指すドラッグリポジショニングでは、多くの場合、既に臨床で使用されている薬に

ついて、これまでとは異なる適応症を見出すことを目的としている。目的の中心は、既存

薬の利用による患者負担軽減・医療費削減や、有効な治療薬が無い・少ない疾患に対する

早急な治療薬供給である。そこには、適応拡大によりもたらされる企業利潤の規模や、知

的財産をどのように確保し独占性を保持するかなどの、経済的諸条件が考慮されることは

あまりない。このような目的の相違が、アカデミアによるドラッグリポジショニングの成

果の企業による活用を躊躇させる要因となっていると考えられる。しかし、患者の視点に

立てば、アカデミアが目指すドラッグリポジショニングからの恩恵は非常に大きい。今後

は、国の主導により、アカデミアによるドラッグリポジショニングの結果を臨床開発、承

認取得に結びつけるための新たな枠組みを構築することが必要であると考える。

【参考文献】

1) Lamb, J., et al, The connectivity map: using gene-expression signatures to connect

small molecules, genes, and disease, Sci., Sep 29, 313(5795), 1929, 2006.

2) 堀本勝久, ビッグデータを利用した創薬, 実験医学, 33(4), 633, 2015.

3) 堀本勝久、福井一彦 , オミックスデータのシステム数理情報解析 , 遺伝子医学

MOOK29 号「オミックスで加速するがんバイオマーカー研究の最新動向」(メディカ

ルドゥ-), 105, 2015.

4) フリーソフトウェア「R」について, http://r-forge.r-project.org/

5) An embryonic stem cell-like gene expression signature in poorly differentiated

aggressive human tumors, Ben-Porath, I., et al, Nat. Genet., May 40(5), 499, 2008

Page 105: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 98 -

第3節 マイクロバイオーム創薬のアプローチ法

はじめに

近年、皮膚表面、消化管、口腔内などに存在している共生細菌群がヒトの体の恒常性を

維持するために極めて重要であり、このバランス変化が、多くの疾患を引き起こす環境要

因の一つであることも次々と報告されてきている。このような成果の要因には、次世代シ

ークエンサーの技術革新による糞便中の細菌メタゲノム解析、メトボローム解析技術の向

上による糞便中代謝物測定、患者由来細菌を移入し疾患発症を評価できるノドバイオード

マウスの普及が挙げられる。しかしながら、その一方で、人種者、地域差による変動が極

めて大きく、そのため人種・地域ごとのデータ標準化ならびにプロトコールの標準化も必

要であり、世界的にも標準化の検討が進められている。また、疾患関連性を明らかにして

いく上では、細菌のメタゲノム、メタボロームに加え、宿主側のゲノムや臨床情報が必要

となり、まさにビッグデータの解析が要求される。

そのような中で、マイクロバイオームに期待されるものとして、未病の治療、予防医療

が挙げられ、本節では、このようなマイクロバイオームと疾患関連性の概要ならびに今後

の創薬への可能性と課題について、国内を代表する若手研究者として、慶應義塾大学・先

端生命科学研究所の福田真嗣特任准教授、東工大生命理工学研究科・生命情報の山田拓司

准教授にヒアリングを実施し、その内容をまとめた。

第3節関連ヒアリング先とヒアリング概要

ヒアリング先 概要

1

慶應義塾大学

先端生命科学研究所

福田 真嗣 特任准教授

「マイクロバイオーム研究からの先制医療や創薬へ

の展望及びその課題」

腸内細菌叢から得られるメタゲノム情報などをビッ

グデータと捉え、ビッグデータ解析研究の一例とし

て、細菌叢研究の現状について、腸内細菌叢を中心に、

疾患との関り、特徴、創薬や医療(予防医療。未病治

療)への取り組み、腸内細菌叢研究の課題と今後の展

望について伺った

2

東京工業大学

生命理工学研究科

生命情報

山田 拓司准教授

「マイクロバイオーム・メタゲノム関連データ解析の

現状と創薬や先制・予防医療に向けた今後の課題なら

びに将来展望」

マイクロバイオーム研究におけるプロトコールの標

準化が進められている。また、標準化と並行して、マ

イクロバイオームにフォーカスとした創薬を推進す

るために、腸内細菌叢の代謝マップの作成も進められ

ている。腸内細菌の代謝マップに関しては、日本はノ

ウハウを蓄積しており、勝ち目がある腸内細菌の代謝

産物の解析研究を更に進めるべき。マイクロバイオー

ムといったビッグデータの解析概要から現状と課題

について解説。

Page 106: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 99 -

〔1〕 マイクロバイオーム研究からの先制医療や創薬への展望及びその課題

ヒアリング先:

慶應義塾大学先端生命科学研究所

福田 真嗣 特任准教授

要約

腸管内には、数百種類以上でおよそ 100 兆個にもおよぶヒトの体細胞数を超える細菌が

生息し、細菌同士あるいは細菌と宿主との間で相互作用しながら腸内生態系(腸内エコシ

ステム)を形成し、生体恒常性の維持に関与していることが明らかにされてきている。

細菌叢(マイクロバイオーム)のバランスが乱れることを dysbiosis と呼ぶが、特に、

腸内細菌叢の dysbiosis は、炎症性腸疾患などの消化管関連疾患をはじめ、がん、自己免

疫疾患、炎症性疾患、代謝性疾患、神経疾患など、各種疾患の発症などに関与しているこ

とが報告されている。また、メタゲノム解析(メタゲノミクス)とメタボローム解析(メ

タボロミクス)を組み合わせた「メタボロゲノミクス」により、腸内細菌由来の代謝物質

が生体恒常性維持に重要な役割を果たしていることが明らかになってきている。更に、腸

内細菌叢の特徴として、加齢により変化することや地域差があること、また個々人で異な

ることが明らかになっているが、それら遺伝的背景よりも生活習慣、特に食習慣が大きく

影響していることも明らかになってきている。

一方、腸内細菌叢の基礎研究を創薬や治療に応用する試みも始まっている。便秘薬を慢

性腎疾患の悪化抑制に応用するドラッグリポジショニングや腸内細菌のトリメチルアミン

産生阻害化合物による動脈硬化抑制剤の開発などがマウス実験により報告されている。ま

た、偽膜性大腸炎患者や潰瘍性大腸炎患者の治療に健常人の便中の細菌叢を移植する便細

菌叢移植に関する報告もされている。

今後の課題として、基礎研究や応用研究の基盤データとなる、健常な日本人の腸内細菌

叢データベース構築が挙げられる。健常な日本人を対象としたコホート研究により、腸内

細菌叢のメタボロゲノミクスデータに宿主のゲノムデータ、生活習慣や食習慣、医療情報

などを統合したデータベースを構築することは、腸内細菌叢と健康や疾患との関連性を明

らかにする基盤になると考えられる。これらの研究を推進するためには、オールジャパン

体制の研究推進、専門研究者への科学研究費支援、便の採取、保管のための試薬や器具の

開発、ゲノムや代謝物質の抽出・分析装置の開発などが必要不可欠と考えられる。

1. はじめに

医薬品開発の効率化が叫ばれて久しい中、創薬シードが枯渇し、稀少疾患やアンメット

メディカルニーズを対象とした創薬展開、オープンイノベーションによるシーズ探索など

様々な試みが行われている。医薬品開発の難易度が上昇し、新規の創薬コンセプトが求め

られている中、腸内細菌叢を標的とした疾患予防、創薬、治療に注目が集まっている。本

稿では、細菌叢から得られるメタゲノム情報などをビッグデータと捉え、ビッグデータ解

析研究の一例として、細菌叢研究の現状について、腸内細菌叢を中心に、疾患との関り、

特徴、創薬や治療への取り組み、腸内細菌叢研究の課題と今後の展望について伺ったので

報告する。

Page 107: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 100 -

2. 腸内細菌研究の背景

腸内細菌研究が急激に進歩した一番の要因は、次世代シークエンサー(Next Generation

Sequencer: NGS)の出現により、個々の細菌を分離培養することなく、直接的に腸管内

細菌のゲノム(遺伝子)の解析を可能にしたメタゲノム解析技術によるものである。また、

メタボロミクス、即ち、メタボローム解析技術やこれらのデータを取り扱うバイオインフ

ォマティクスの進歩も挙げられる。メタボローム解析には、ガスクロマトグラフィー質量

分析法(GC-MS)、液体クロマトグラフィー質量分析法(LC-MS)、キャピラリー電気泳

動質量分析法(CE-MS)などが主に用いられているが、検出可能な代謝物質や前処理方法、

網羅性、定量性などがそれぞれの機器により特長が異なる。従って、目的に合った装置を

選択する必要があり、複数の装置で分析することで,より多くの代謝物質情報を得ること

が望ましい。その中でも、CE-MS はイオン性化合物に対して高い分離能を有しており、

細菌代謝物質のような荷電低分子の代謝物質を網羅的に測定できる。慶應義塾大学先端生

命科学研究所では、主に CE-MS を用いており、国内の腸内細菌研究におけるメタボロー

ム解析の中心となっている。これらの研究により、健康維持や疾患発症に関与する代謝物

質が明らかにされたことは、腸内細菌研究の発展に大きく寄与しているものと考えられる。

再発性 Clostridium difficile 感染性大腸炎(Clostridium difficile infection:CDI)に対

する便細菌叢移植療法(fecal microbiota transplantation:FMT)が著しい効果を示した

ことや、無菌マウスに特定の細菌(叢)のみを生着させたノトバイオートマウスを用いた

疾患モデルの解析から、疾患と腸内細菌叢との間に相関があるという研究結果が数多く報

告されるようになり、腸内細菌叢の変化が、発症原因、若しくは環境要因であるといった

エビデンスが得られたことも腸内細菌を標的とした疾患予防、創薬、治療に注目が集まっ

ている要因と考えられる。

3.腸内細菌叢とは

ヒトの腸内にはおよそ 1,000 種類、100 兆個を超える腸内細菌が生息しており、その総

遺伝子数はヒトの体細胞数(約 37 兆個)1)の 25 倍以上にもなると報告されている2)。そ

のため、腸内細菌叢は、一つの臓器と例えられ、細菌同士だけでなくヒトの細胞とも複雑

に相互作用しながら、消化管をはじめとした全身の臓器の恒常性維持に重要な働きをして

いると言われている。2000年のノーベル医学、生理学賞受賞者 Joshua Lederberg 博士は、

人間は微生物の細胞も含めた「超生命体:Superorganism」である、と述べている3)。ヒト

の健康と病気を理解するには、宿主と常在細菌叢の相互作用を理解すること、腸内細菌叢

全体を一つの臓器として理解すること、そして、細菌叢を構成している個々の細菌の機能

を理解すること、これらを統合的に進めることが重要と考えられる。

4.細菌叢と疾患

腸内環境は種々の要因で dysbiosis をきたすことが知られている。主な変動要因として

は、偏った食事、ストレスや過労、投薬、気候や温度変化、細菌感染、そして加齢などが

指摘されている。遺伝的素因にこれらの環境変動による dysbiosis が重なることが疾患発

症に繋がると考えられている。以下、未病などに対する先制医療・予防医療の観点から、

疾患発症と腸内細菌などの共生細菌叢との関連性について、紹介する。

Page 108: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 101 -

(1)腸内細菌叢と大腸炎、大腸がん

腸内細菌叢と大腸炎、大腸がんとの関連性については、大腸炎や大腸がん発症に関与す

る遺伝子を変異、又は欠損させたマウスに対する無菌マウスを作製し、特定の腸内細菌を

移植し影響を解析する、発がん物質投与に対しての腸内細菌の寄与を解析する、抗生物質

投与により腸内細菌叢を変化させ炭水化物や高脂肪食の影響を解析するなどの研究報告が

ある。

ヒトの炎症性腸疾患動物モデルである、T 及び B 細胞欠損マウスに CD4+CD45Rbhigh T

細胞を移入し、Helicobacter hepaticus を移植した大腸炎モデルでは、Bacteroides fragilis

が産生する PSA(polysaccharide A)が大腸炎抑制作用を示すことが報告され、PSA が、

炎症性サイトカイン IL-17 の産生抑制や CD4 + T 細胞の IL-10 産生に関与し、抗炎症作用

を示すことが明らかにされている4)5)。

大腸がんとの関連性については、腸炎自然発症 IL-10 欠損マウスに変異原

azoxymethane (AOM)を暴露し大腸菌を移植すると、大腸がんを発症し、大腸菌の産

生する polyketide 合成酵素が関与していることが報告されている6)。

腸内細菌叢由来代謝物質と宿主の遺伝子変異との関係では、家族性大腸ポリポーシス

(familial adenomatous polyposis; FAP)の原因遺伝子 APC(adenomatous polyposis coli)

の変異と DNA 修復遺伝子 MSH2(Mutator S Homologue 2)の欠損が合併しているマウ

ス(ApcMin/+MSH2-/-)は、大腸がんを発症し、その発症メカニズムに腸内細菌由来代謝物

質である酪酸が関与していることや、抗生物質投与により腸内細菌叢を除去すると大腸が

ん発症が抑制されることが報告されている7)。

がん遺伝子 Kras の変異活性型(K-rasG12Dint)発現マウスに高脂肪食を摂取させること

により起こる小腸の腫瘍形成には、高脂肪食による小腸内 dysbiosisが関与していること、

さらには抗生物質投与により腫瘍形成が抑制されること、酪酸の投与により小腸内

dysbiosis が改善されることが報告されている8)。

このような報告は、動物実験ではあるものの、がん予防といったヘルスケアの面で興味深い。

(2)腸内細菌叢と宿主免疫系

腸管は病原性細菌をはじめ多様な抗原に暴露されており、腸内細菌は腸管免疫系構築に

深く関与し、例えば腸内細菌の一種、腸管セグメント細菌(segmented filamentous

bacterium: SFB)は、自己免疫応答や細菌感染防御に関与しているインターロイキン 17

産生 T 細胞の分化誘導を促進し9)、クロストリジウム属細菌群は制御性 T 細胞(regulatory

T cell:Treg)の分化誘導を促進することが知られている10)~11)。更に、無菌マウスを

用いた研究から、生後初期段階で腸内細菌叢の多様性が血液中 IgE 濃度に影響すること1

2)、妊娠時に摂取した繊維質食物が腸内細菌により代謝され生じた短鎖脂肪酸が Treg の

誘導を促進し、肺における気道炎症物質の産生を制御することが明らかにされている13)。

(3)腸内細菌叢と代謝疾患

Dysbiosis が宿主のエネルギー代謝や栄養摂取、糖尿病、動脈硬化を誘導することが報

告されている。

代謝性疾患と腸内細菌叢の関係では、ob/ob 肥満マウスと正常マウスの腸内細菌叢をそ

Page 109: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 102 -

れぞれ無菌マウスに移植した結果、肥満マウスの腸内細菌叢を移植されたマウスは正常マ

ウスのそれを移植されたマウスより体脂肪増加量が有意に高く、腸内細菌叢が宿主のエネ

ルギーバランスに影響を与えることが示唆されている14)15)。これらのことは、先制医療

や慢性疾患進行予防の観点で興味深い。

糖尿病では、2012 年に中国から健常人と糖尿病患者の便中細菌叢のメタゲノム比較解析

結果が報告され、糖尿病患者では酪酸の生合成に関わる細菌が減少していることが明らか

にされている16)。2013 年には、ヨーロッパの女性の健常人、境界型糖尿病及び 2 型糖尿

病患者を対象とした便中細菌叢のメタゲノム解析の結果が報告され17)、酪酸を産生する

腸内細菌の数が健康な女性に比べ減少している点は中国の結果と一致していたが、ヨーロ

ッパ人と中国人で糖尿病の診断に繋がるメタゲノムマーカーが異なったことから、基盤と

なる地域ごとの腸内環境データベースの重要性が示唆されている。

肝臓がんと腸内細菌叢の関係では、発がん物質 DMBA(7,12-dimethylbenz[α]

anthracene)投与マウスを高脂肪食群で飼育した発癌モデルにおいて、高脂肪食摂取群に

抗生物質を投与すると肝がんの発症が抑制されたことより、腸内細菌叢の関与が示唆され

ている。さらに、便中代謝物質のメタボローム解析により、腸内細菌が産生する二次胆汁

酸の一種であるデオキシコール酸(Deoxycholic acid:DCA)が肝臓の肝星細胞に作用し、

がんを発症させることが明らかにされている18)。

動脈硬化に対する腸内細菌叢の関与では、カルニチン誘発動脈硬化の場合、食品に含ま

れるカルニチンが腸内細菌によりトリメチルアミン(trimethylamine:TMA)へと代謝

され、吸収された TMA が肝臓でトリメチルオキシド(trimethyloxide:TMAO)に変換

され、マクロファージの泡沫化を促進することでアテローム性動脈硬化が発症することが

明らかにされている19)~21)。

これらの研究成果は、腸内細菌叢及びその代謝物質がかかわる疾患の発症予防を考える

上で、有益なものと期待される。

(4)腸内細菌叢と脳機能

腸内細菌叢と脳との関係では、多発性硬化症22)、脳の発達、ストレス耐性、自閉症、

社会行動異常、神経伝達物質の一つセロトニンの産生などについて報告されている。

脳の発達に関しては、腸内細菌が脳神経の発達に関与していることが報告されており、

SPF (Specific Pathogen Free)環境下の 飼育マウスに腸内細菌を移植すると脳神経の成

熟を促すホルモン産生が誘導されることが認められ、腸内細菌が脳の正常な発達に影響を

与えている可能性が示唆されている23)。

乳酸菌の 1 種である Lactobacillus rhamnosus を摂食させたマウスは不安を感じにくい

ことが、拘束ストレスモデルやコルチコステロン(ストレス誘導ホルモン)の血液中濃度

を測定することで明らかにされ、この行動は迷走神経を遮断することで回避されることが

報告されている24)。

自閉症スペクトラム障害(autism spectrum disorder:ASD) については、妊娠マウ

スに免疫系を刺激する poly(I:C) (Polyinosinic:polycytidylic acid)を注入する ASD

モデル(maternal immune activation:MIA) マウスを用いた成果が報告されている25)。

この ASD マウスより産まれた仔マウスでは腸内細菌叢のバランスの乱れと腸管透過性亢

Page 110: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 103 -

進が観察され、このマウスにポリサッカライド A を産生する Bacteroides fragilis(B.

fragilis)をプロバイオティクスのように経口投与すると、腸内細菌叢や腸官透過性の改善

とともに ASD の症状改善も認められている。さらに、ASD モデルで増加し、B. fragilis

の投与で正常値に戻る代謝物質として、血清のメタボローム解析の結果、4-エチルフェニ

ル硫酸(4-ethylphenylsulfate:4EPS)が同定され、4EPS 投与により ASD 様の症状が

発症することも確認されている。

妊娠マウスに高脂肪食を長期間摂食させると、産仔に社会行動異常を呈するのは、脳内

オキシトシンの産生低下が原因で、このオキシトシン産生低下に腸内 dysbiosis が関与し

ているとも考えられている26)。

ストレス制御に関与している神経伝達物質であるセロトニンは、腸が主要な産生臓器で

あるが、腸で生産されたセロトニンが脳に作用するかについては諸説が提唱されている。

腸におけるセロトニンは、ある種の芽胞形成腸内細菌が産生する代謝物質が腸管内分泌細

胞に作用することにより産生され、産生されたセロトニンが蠕動運動や血小板機能を改善

する作用を有していることが明らかにされている27)。

妊娠中のストレスなどの負荷と発達障害などについて、妊婦時に介入し、幼児の自閉症

などが軽減できるのであれば先制・予防医療の面で有用であり、期待できる。

(5)口腔内細菌叢と疾患

口腔内細菌叢の 16S rRNA 遺伝子の網羅的解析(16S メタゲノム)から、各個人の口腔

内細菌叢は比較的安定で、日内変動は個人間の差よりも小さく、個人の特徴を把握できる

可能性が示唆されている28)。

九州久山町と韓国の健常人について唾液の細菌叢について16Sメタゲノム解析を行った

結果、健常人細菌叢に有意な差が認められ、日本人では、歯周炎患者の唾液に高比率で認

められる Prevotella、Veillonella 等の菌属が韓国人と比較して多く、口腔常在細菌叢構成

の違いが、韓国人よりも日本人に歯周炎が多い理由である可能性が示唆されている29)。

さらに、口腔内細菌叢と膵臓がんとの関連も指摘されている。膵臓がん患者と健常人に

おける口腔内洗浄液についての細菌叢の 16S メタゲノム解析を実施し、歯周病の原因菌で

ある Porphyromonas gingivalis と Aggregatibacter actinomycetemcomitans という 2 種

類の菌の保有者が、膵臓がんのリスクが有意に高く、口腔内の特定の歯周病菌が膵臓がん

の発症リスクを高めることが示唆されている30)。

唾液などの口腔内細菌叢の解析対象試料は、便採取に比べ、同一個人から連続的に採取

しやすく、コホート研究に適していると考えられる。唾液と歯垢では細菌叢が違うという

事実もあり、唾液で取得できるデータを健康維持に活かすための技術開発が求められてい

る。個人差の観点からは、腸内細菌と口腔内細菌のどちらが安定したデータを取得できる

か注目されている。

5.腸内細菌叢由来代謝物質による生体恒常性の維持

腸内細菌由来の代謝物質が宿主の恒常性維持に関与している例として、腸管出血性大腸

菌 O157 感染に対する腸内細菌の一種、ビフィズス菌の感染予防効果が報告されている31)。

無菌マウスにプロバイオティクスとして使用されている Bifidobacterium longum(BL)、

Page 111: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 104 -

又は、使用されていない Bifidobacterium adolescentis (BA)を定着させ、致死量の O157

を経口感染させると、BL 定着マウスは生存するが BA 定着マウスは感染死する。腸管内

腔における O157 菌数や産生される志賀毒素濃度に有意差はなく、血中志賀毒素濃度のみ

異なっていることが認められている。メタボロゲノミクスアプローチから、そのメカニズ

ムとして、BL 株では、ATP 結合カセット型の糖トランスポーター遺伝子の発現により遠

位結腸における糖代謝が可能で、代謝物質として産生される酢酸が、宿主腸管上皮細胞の

バリア機能を高めることで、O157 による腸管感染症を予防していることが明らかにされ

ている。酢酸に O157 感染症予防効果があったことから、腸管内酢酸濃度を高める工夫を

した、酢酸化レジスタントスターチをマウスに摂取させることで、O157 感染死が抑制され

ることも確認している。

酢酸以外にも、腸内細菌が産生する乳酸が絶食後の再摂食時に生じる大腸上皮細胞の過

増殖を促進すること、短鎖脂肪酸の一つである酪酸が大腸粘膜における制御性 T 細胞の分

化誘導の促進に関与するなど、腸内細菌が産生する代謝物質が宿主の恒常性維持に関与し

ていることが明らかになってきている。

6.腸内細菌叢の特徴

細菌は、消化器系のみならず皮膚や口腔内など体表面や粘膜にも存在するが、特に、消

化管は最も多くの細菌が定着している臓器とされている。健康成人の口腔から大腸までに

定着している細菌の種類では、ビフィズス菌のような嫌気性菌が直腸や盲腸に非常に多い

ことが知られている。

(1)腸内細菌叢の年齢による変化

腸内細菌叢の構成は年齢によって変化することが明らかにされている。ビフィズス菌な

どが含まれる Actinobacteria 門の細菌群は加齢に伴い減少し、バクテロイデス属菌などが

含まれる Bacteroidetes 門の細菌群は増加し、大腸菌等が含まれる Proteobacteria 門の細

菌群は生後多く存在するが、年齢とともに減少し老齢期に再度増加するような推移を辿る

ことが報告されている32)。

腸内細菌叢がどの時期にどのように安定するのかを明らかにすることが、今後の研究課

題とされている。生後、最初に定着する菌がその後の細菌叢の方向性を決定する可能性も

あることから、生活環境やライフスタイルが腸内微生物生態系の形成に重要な役割を果た

していると推測されている。

(2)腸内細菌叢の地域、民族、個人による違い

地域や民族、個人による違いについては、前述した糖尿病などの代謝性疾患で報告され

ている以外に、以下のような報告がある。

アジア地域の子供の腸内細菌叢を比較した結果では、日本(東京、福岡)の子供は、他

国に比べてビフィズス菌が多くプレボテラ属菌(Prevotella)が少ないことが明らかにな

っている。一方、インドネシア(Bali、Yogyakarta)、タイ(Khon Kaen)の子供は、ビ

フィズス菌が少なく、プレボテラ属菌が多いという結果が示されている33)34)。

全世界的な比較でも、国により腸内細菌叢に違いがあり、日本はオーストリア人と比較

的似ていること、米国人と中国人、ペルーやベネズエラ、マラウイ人といった南米や南ア

フリカ人が類似していることが明らかになっている。一方、国間と比較して同じ国同士の

Page 112: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 105 -

人は有意に菌叢が似ていることも示されている。

個々人の腸内細菌叢が異なる例として、ある種の腸内細菌の存在比が、摂取された食物

の糖代謝に大きく影響することが報告されている36)。

朝食や夕食に大麦を食べると次の昼食や朝食に何を食べても血糖値が上昇しにくくなる

といった、大麦のセカンドミール効果が知られている。そのメカニズムとして、腸内に存

在するプレボテラ属菌が多く、大麦摂取によりプレボテラ属菌が増加する人は、大麦を摂

取すると耐糖能改善効果を得られることが明らかにされた。炭水化物を代謝できるプレボ

テラ属菌は、大麦に含まれるβグルカンを代謝し、産生される代謝物質が耐糖能改善効果

に寄与すると考えられている。

ヒトの腸内には、個々人の腸内環境に最も適した腸内細菌が定着していると考えられて

いる。腸内細菌叢を制御する薬剤や食品の創出には、個々人の腸内環境に対する適性を考

えることが重要とされている。

7.腸内細菌叢を標的とした創薬

前述したように、腸内細菌叢の乱れが遠隔臓器に影響を及ぼすことが報告され、腸内細

菌叢を制御することで遠隔臓器の疾患予防や治療に繋がる可能性が期待されている。

(1)ドラッグリポジショニング

ドラッグリポジショニング(drug repositioning:DR)研究の成果として、東北大学の

阿部らは、便秘症治療薬のルビプロストンが、マウス腎不全モデルにおいて、腎機能悪化

による血中尿毒素蓄積を軽減し、腎臓の障害進行を抑制すると報告している。ルビプロス

トンは、腸管内クロライドチャネルを活性化し腸液の分泌を増加させ、腸管内容物の移動

を促進し便秘症を改善するとされている37)。腎臓は、体内の不要物質の排泄の役割を持

つが、慢性腎不全(chronic kidney disease:CKD)では、尿として排泄される尿毒素が

血液中に蓄積し、腎臓をはじめとして多臓器に悪影響を与えることが明らかにされている

38)39)。CKD では、腸内細菌叢を含む腸内環境全体が悪い方向に変化していること、尿

毒素のインドキシル硫酸やパラクレゾールなどの産生に腸内細菌叢が関与していることが

報告されている40)41)。

このような背景から、腎不全マウスモデルを作製し、ルビプロストンを投与した結果、

対照マウスと比較したところ、腸液の分泌が増加し、腎不全時における腸内環境の悪化が

改善され、血中尿毒素量が低減することが明らかにされた42)。

腎不全マウスでは、ラクトバチルス菌や プレボテラ菌の減少が認められたが、ルビプロ

ストン投与によりこの減少が改善していることが示された。ルビプロストンは腸内環境、

腸内細菌叢の変化を介して尿毒素の蓄積を減少させ、慢性腎臓病の進行を抑制することが

期待されており、小規模臨床試験が実施されている。

(2)腸内細菌叢を標的とした創薬

腸内細菌叢を標的とした創薬では、腸内細菌由来 TMA 産生阻害による動脈硬化抑制剤

の開発が行われている21)。

食事で摂取された食物由来コリンは腸内細菌により TMA に代謝され、肝臓で TMAO に

変換される。TMAO がマクロファージの泡沫化を促進しアテローム性動脈硬化が誘発され

Page 113: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 106 -

ることは前述のとおりである。コリンから TMA への腸内細菌による代謝反応を阻害する

化合物のスクリーニングから取得した化合物、3,3-dimethyl-1-butanol (DMB) をマウス

の動脈硬化モデルに投与した結果、動脈硬化が改善されたことが報告されている。腸内細

菌によるコリンからの TMA 産生はヒト腸管内でも生じていることから、今後の展開が注

目されている。

腸内細菌の代謝物質が最終的に疾患と関ることが今後益々明らかになってくると予想さ

れ、ヒトと共生している細菌を標的とした疾患治療薬の開発が期待されている。

(3)腸内細菌叢移植による治療

腸管感染症の一つである CDIは、抗菌薬の使用による腸内 dysbiosisの結果 Clostridium

difficile(CD)が増殖し、毒素が産生されることで腸管内に偽膜性炎症が生じる疾患であ

る。通常はバンコマイシン等の薬剤投与により治癒するが、治療抵抗性菌の感染の場合は

再発が繰り返される難治性感染症である。欧米では症例数が約 50 万人にのぼり、年間 3

万人以上が死亡しているため、5,000 億円以上の医療費が費やされている。CDI 患者に対

し抗生物質より圧倒的に治療効果が高い手法として、FMT 法が注目されている。2013 年

に報告された、FMT と CDI 治療薬バンコマイシンとのランダム化比較試験(randomized

control study:RCT)では、バンコマイシン単独投与で約 30%の治療効果を示したのに対

し、バンコマイシン投与と健常人の FMT 併用で約 80%の治療効果があり、2 回目に別の

健常人の FMT を行った結果を合計すると 90%以上の治療効果が認められている43)。

一方、潰瘍性大腸炎(Ulcerative colitis:UC)の RCT では、FMT による治療効果が異

なる結果が報告44)45)されている。2 報の直接比較は条件が異なるためできないが、CDI

治療と比較し治療効果が認められた場合でも寛解率は 50%以下と報告されている。抗生物

質による前処置なしの FMT 治療のため、使用した便の違いが結果に大きく影響したと考

えられている。「スーパードナー」(複数の患者に対する FMT において治療効果が認めら

れているドナー)の存在も指摘されており、どのような便に治療効果が期待できるのか、

どの細菌が重要なのか、便選択の指標を明らかにした評価系の確立が求められている。

更に、FMT で移植された細菌叢は患者腸管内に定着しにくいと指摘されている。他人

の腸内環境は移植細菌叢にとって生育に適していないということで、どのようにして定着

できる環境を整えるかが課題とされている。そのためには、腸内生態系がどのように構築

されていくかを理解することが必要とされている。一方、dysbiosis が疾患に関与している

ことがマウス実験モデルで証明されている疾患に対しては、FMT の効果が期待され、各

種疾患に対する臨床試験が検討されている。

腸内細菌叢の実用化研究では、FMT は心理的に難しいという視点から米国のバイオテ

ック企業が、CDI 再発防止用、UC 治療用、抗生物質抵抗性細菌除去用の腸内細菌カクテ

ルを作製し注目されている。便の中から有効な微生物を選抜しカプセル化して薬剤として

投与するという試みである。この企業が米国株式市場に上場したところ、時価総額 19 億

ドルに達し、細菌叢を用いた治療に対する期待の大きさが伺われた。しかし、CDI 再発防

止用腸内細菌カクテルが臨床第 2 相試験でエンドポイントを達成できず、腸内細菌叢に対

する更なる理解が必要なことや腸内細菌叢を利用した治療について課題が多いことが明ら

かになっている。

Page 114: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 107 -

FMT による CDI 治療が効果的であることや「スーパードナー」の存在は事実であると

考えられており、治療効果を示す「因子」を明らかにし、実用化することが期待されてい

る。

8.今後の課題と展望

腸内細菌叢の研究成果を日本人の健康生活維持に活用するために実施すべき課題として、

以下の点が指摘されている。

第 1 に、日本人の腸内環境データベースの構築が必要とされている。同一健常人の腸内

細菌叢情報を経時的に取得しデータベース化することで、健常人参照データとして、腸内

環境の改善や治療による患者の腸内細菌叢の変化を解釈する際に利用することが考えられ

ている。

第 2 に、腸内細菌叢の変化が疾患の原因なのか、結果なのか、を明らかにするために、

コホート研究の必要性が指摘されている。宿主のゲノム、生活習慣、食習慣の情報に腸内

細菌叢のメタボロゲノミクスデータを加味する解析を、同一健常人について前向きコホー

ト研究により行うことで、腸内環境を適切に制御する方法を見出すことに繋がると期待さ

れている。

第 3 に、メタボロゲノミクスを実施するための更なる技術開発も求められている。試料

である便の簡便な採取法や試料保管方法の開発は、健常人の協力を得るために重要である

と考えられている。その上、ランニングコストの安価なシークエンサーや精度、感度の向

上した質量分析計の開発も必要とされている。

第 4 に、国の役割として、日本人の腸内環境研究の基盤構築や応用研究に向けたオール

ジャパン研究体制構築のリーダーシップの発揮が求められている。解析拠点を設け、それ

らを統括する組織によるネットワークの構築も必要であろう。

研究投資の面では、腸内細菌学研究に対し挑戦的研究課題で取り組んでいる若手研究者

への科学研究費配分も求められている。先行する欧米の研究に対峙するためには、若手研

究者の自由な発想に基づく研究の発展が期待されている。更に、第 3 項に記した、試薬、

器具、機器の開発への支援も求められている。

腸内細菌の特徴(腸内細菌叢の構成や代謝物質の機能)に関する理解とヒトの腸内環境

の特徴を把握することで、腸内環境の制御法を見出し、健康維持や疾患予防、治療戦略に

繋げることが望まれている。

9.執筆担当者所感

次世代シークエンサーやオミクスアプローチの導入により、腸内細菌の同定や疾患によ

る変動、そして、腸内細菌由来代謝物質の機能や宿主への影響の解明が進展し、腸内細菌

叢の特徴に対する理解も進んでいる印象を受けた。

一方、UC の FMT 治療成績で結果が異なったことに代表されるように、腸内細菌研究

において明らかにすべき点が多いことも理解できた。科学的指標を設定できるような分子

レベルの解析やメカニズム解析が進むことを期待したい。そのためにも、基礎研究、応用

研究の基盤となる、日本人の健常人腸内細菌叢データベースを早急に整備していただきた

い。個々人のゲノム情報、生活習慣、食事の情報に加え、腸内細菌叢のメタボロゲノミク

Page 115: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 108 -

ス情報を収集するには、多大な時間、労力と費用を必要とすることが容易に推測できる。

試料収集の点でも、健常人に対し便の提供に協力していただくことは大変であると言われ

ている。現在進行中のゲノムコホート研究と連携し、採血、採尿、に採便を追加していた

だく仕組みはできないものだろうか。資源(ヒト、モノ、カネ、ジカン)の効率的活用を

期待したい。

腸内細菌学の分野は、日本がリードしてきた研究分野の一つであるが、基盤整備や応用

研究、産業化では欧米が先行しているのが現状である。欧米に伍していくにはどのような

施策、仕組みが必要なのか、国の取り組みも含めて考えることが求められていると感じた。

【参考文献】

1) Qin, J. et. al. Nature, 464, 59-65, 2010

2) Bianconi, E. et. al. Ann. Hum. Biol. 40, 463-471, 2013

3) Joshua Lederberg. Science, 288, 287-293, 2000

4) Mazmanian SK, et al., Nature 453, 620-625, 2008

5) Round JL, et al., Science 332(6032): 974–977, 2011

6) Arthur JC, et al., Science 338(6103):120-123, 2012

7) Belcheva A, et al., Cell 158(2):288-299, 2014

8) Schulz MD, et al., Nature 514, 508-512, 2014

9) Ivanov II et al., Cell 139(3):485-498, 2009

10) Atarashi, K. et al., Science 331, 337–341, 2011

11) Atarashi, K. et al., Nature 500, 232–236, 2013

12) Cahenzli J, et al., Cell Host Microbe 14(5):559-570, 2013

13) Thorburn AN, et al., Nat Commun 6: 7320, 2015

14) Turnbaugh PJ et al., Nature 444(7122):1027-1031, 2006

15) Ridaura VK, et al., Science 341, 1241214, 2013

16) Qin J, et al., Nature. 490(7418):55-60, 2012

17) Chatelier EL, et al., Nature. 500(7464):541-546, 2013

18) Yoshimoto S, et al., Nature 499(7456):97-101, 2013

19) Wang Z, et al., Nature. 472(7341):57-63, 2011

20) Koeth RA, et al., Nat Med. 19(5): 576–585, 2013

21) Wang Z, et al., Cell 163(7):1585-1595, 2015

22) Sushrut, J. et. al. Nature communications | 7:12015 | DOI: 10.1038/ncomms12015

| www.nature.com/naturecommunications

23)Heijtz DR, et al., Proc Natl Acad Sci U S A. 108(38): 16050–16055, 2011

24) Bravo JA, et al., Proc Natl Acad Sci U S A. 108(7):3047-3052, 2011

25) Hsiao EY, et al., Cell 155(7): 1451–1463, 2013

26) Buffington SA, et al., Cell 165(7):1762-75, 2016

27) Yano JM, et al., Cell, 161(2), 264–276, 2015

28) Yukuto S, et. al. PLOS ONE | DOI:10.1371/journal.pone.0131607 June 29, 2015

29) Takeshita T, et al., Sci. Rep., 4: 6990, 2014

Page 116: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 109 -

30)Fan X, et al., Gut doi:10.1136/gutjnl-2016-312580

31) Fukuda S, et al., Nature, 469, 543-547, 2011

32) Odamaki T, et al., BMC Microbiology 10.1186/s12866-016-0708-5, 2016

33) Nakayama J, et al., Sci Rep. 5: 8397. doi: 10.1038/srep08397, 2015

34) Nishijima S, et al., DNA Res 23 (2): 125-133, 2016

35) Karlsson FH, Nature 498(7452):99-103, 2013

36) Kovatcheva-Datchary P, et al., Cell Metabolism 22(6): 971-982, 2015

37) Lacy BE, Levy LC. J.Clin. Gastroenterol, 41,345-351, 2007

38) Vivekanand Jha. et.al. Lancet, 382,260–72, 2013

39) Vanholder R. et. al. J Am Soc Nephrol. 19, 863-70, 2008

40) Vaziri ND et.al. Kidney Int. 83,308-15, 2013

41) Timothy W. et.al. Kidney Int. 81:949-954 2012

42) Mishima E, Fukuda S, J Am Soc Nephrol. 26(8):1787-1794, 2015

43) Nood EV, et al., N Engl J Med 368:407-415, 2013

44) Paul M et.al. Gastroenterology, 149,102-109, 2015

45) Noortje G et. al. Gastroenterology, 149,110-118, 2015

Page 117: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 110 -

〔2〕 マイクロバイオーム・メタゲノム関連データ解析の現状と創薬や

先制・予防医療に向けた今後の課題ならびに将来展望

ヒアリング先:

東京工業大学生命理工学院 生命情報

山田 拓司 准教授

要約

人の腸内には約 1.5kg の細菌が存在し、約 1,000 万もの遺伝子が存在する。そして、様々

な物質を生産し、宿主であるヒトに対して多大な影響を及ぼしている。このような背景か

ら欧米では細菌叢が新しいヒトの臓器として認識され、その研究に大型予算が投じられ、

機能解明と新規創薬ターゲットの同定研究が実施されている。ただ、本領域の研究すべて

が順調という訳では無く、各研究機関の実験手技が異なることから、異なる研究機関のデ

ータを正確に比較することが難しいという課題に直面している。このような背景から、マ

イクロバイオーム研究におけるプロトコールの標準化が進められている。また、標準化と

並行して、マイクロバイオームにフォーカスした創薬(以下、マイクロバイオーム創薬)

を推進するために、腸内細菌叢の代謝マップの作成も進められている。腸内細菌の代謝マ

ップに関しては、日本はノウハウを蓄積しており欧米と比べてもスキルが高い。腸内細菌

研究で後れを取っている日本に勝ち目があるのは、腸内細菌の代謝産物の解析研究を更に

進め、その成果を産業応用していくことであろう。

1.はじめに

近年、炎症性腸疾患や偽膜性腸炎に対し、糞便移植の有効性が示されるなど、マイクロ

バイオームを起点とした医療・創薬が注目を浴びている。そこで、マイクロバイオームの

細菌群集での網羅的ゲノム解析(メタゲノム解析)、代謝ネットワーク解析を通して、食品

や創薬等、産業応用を目指している東京工業大学の山田拓司准教授に、マイクロバイオー

ム創薬における課題、そして将来展望についてお話を伺った。

2.マイクロバイオーム研究の現状と課題

米国では White House から National Microbiome Initiative(NMI)というプロジェク

トがアナウンスされている。そこでは創薬におけるマイクロバイオーム研究の重要性が言

及され、2016 年度と 2017 年度の政府系予算として$121 M、民間からも$400M 以上が投

じられるなど、マイクロバイオーム研究は盛り上がりを見せている。このように、マイク

ロバイオーム研究が世間を賑わせている背景には、次世代シークエンシング技術により発

展したメタゲノム解析の貢献が大きい。これまでの細菌を標的とした研究では、個々の細

菌をそれぞれ培養する必要があったが、メタゲノム解析ではそのような培養過程を経ずに、

どのような細菌がどの程度存在しているかを明らかにすることができる。人の腸内に存在

する、約 1.5kg と言われる細菌叢の遺伝子を次世代シークエンサーにて調べたこれまでの

報告では、ヒト腸内細菌叢には宿主であるヒトの 400 倍の約 1,000 万もの遺伝子が存在し

ていることが分かっている。また、細菌叢は様々な物質を生産し、宿主であるヒトに対し

Page 118: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 111 -

て多大な影響を及ぼしていることも分かってきた。このような背景から欧米では、2008

年頃から大型予算を投じ、その機能解明と新規創薬ターゲットの同定研究を進めている。

現在、米国では NMI、integrative Human Microbiome Project(iHMP)、そして欧州

では Metagenopolis といったプロジェクトが動いており、各種疾患とマイクロバイオーム

との関わりが明らかになりつつある。また疾患ごとにマイクロバイオーム創薬関連ベンチ

ャー企業が誕生し、製薬会社とのコラボレーションが生まれている。さらには、地下鉄の

手すりやベンチに常在するマイクロバイオーム解析を行う MetaSUB というプロジェクト

も開始されている。このようにマイクロバイオーム研究はヘルスケア産業だけでなく他産

業への広がりを見せている。

ただ、本領域の研究すべてが順調という訳では無く、マイクロバイオーム研究では実験

手技の違いにより、得られるデータが大幅に変化するので、異なる研究間でのデータ比較

が難しいという状況である。このような背景から、マイクロバイオーム研究におけるプロ

トコールの標準化が求められている。

3.マイクロバイオーム研究におけるプロトコール標準化を巡る状況

論文発表されるデータを十分に活用していくためには、マイクロバイオーム研究におけ

るプロトコールの標準化が重要である。標準プロトコールに沿って取得したデータ同士は、

異なる研究機関のデータであっても、加工せずに直接比較できる。現在、欧米でも、プロ

トコールやデータ比較法を標準化しようと複数の団体が動き出している。しかしながら、

このような動きがあるにも関わらず、研究室ごとに異なるプロトコールを使い続けるケー

スも散見され、プロトコール標準化の徹底は難しい状況である。日本における標準化に関

しては、AMED の「医と食をつなげる新規メカニズムの解明と病態制御法の開発」という

事業で、国立がんセンターの谷内田 真一ユニット長と山田准教授らが標準化の検討を実施

している。また、最近の報道記事では、製薬企業を含む 17 社が「マイクロバイオームコ

ンソーシアム」を結成し、プロトコールを標準化しようという動きもある。ただ、欧米と

比較して予算も少なく、また官民の意見の統一を目的とした行政のサポートも少なく、依

然としてプロトコールの標準化は難しい状況である。

また、標準化に向けた別の課題は、マイクロバイオーム解析において、全てのオミック

ス解析に適用可能なサンプル処理のプロトコールの作成が難しいということである。例え

ば、メタゲノム解析はメタボローム解析とサンプルの回収方法が異なる。そのため、メタ

ゲノム解析を実施している研究者が、同一のサンプルを利用してメタボローム解析を実施

しようと思っても解析できない。将来的に、どんなサンプルに対しても適応できるプロト

コールが望ましいが、大きな困難が伴うと思われる。例えば、メタゲノム解析用にサンプ

ルを取得・保存する際にはグアニジン塩酸塩の入った水溶液が利用されることが多いが、

グアニジン塩酸塩を含んだ状態では質量分析を用いたメタボローム解析は困難である。

標準プロトコールを作成した後は、その更新に関しても考慮する必要もある。科学技術

が発展するとともに、現行のプロトコールの不備が判明し、変更を余儀なくされる可能性

がある。DNA 抽出法を例に取り上げてみる。細菌叢からの DNA 抽出操作では、サンプル

にガラスビーズを添加し、激しく混ぜる方法が多くの研究者に採用されている。この方法

では、菌が破壊されて菌外に DNA が出てくるが、同時に DNA が細断されるので数百塩

Page 119: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 112 -

基長まで短くなる。シークエンサーとして Illumina 社の MiSeq や HiSeq を利用するので

あれば、元々300 塩基長程度までしか読めないので、DNA 断片が短くても良いが、シーク

エンサーが進化して、長い配列を安価に読めるようになってくると、ガラスビーズを利用

したプロトコールは望まれない可能性もある。理想としては、DNA を細断せず長いまま

取って解析する方が、菌と遺伝子を紐づけやすいので解析面では好まれるが、現時点では

長い配列を読むとなるとシークエンシング費用が高額で、多くの研究者が予算上対応でき

ない。そのため、長い配列を読むことができるシークエンサーを標準機器とするわけには

いかず、物理的には可能であっても費用面で標準化すべきでないと結論される場合もあり

得る。さらに、シークエンサーに関しては、新規機種が次々発売され、性能も年々向上し

ており、同じプロトコールでも 5 年前に得たデータと新たに得たデータを完全に一致させ

るのは無理である。ゆえに、現時点でシークエンシングに関する標準プロトコールを作っ

たとしても、5 年後には役に立たない可能性もある。つまり、標準化するのであれば、プ

ロトコールのバージョンアップを想定して、過去のデータをどのようにブリッジングする

のかを考えておくことが必要である。例えば、日本人で多い菌株を混ぜたサンプルを作成

し、そこからの遺伝子抽出・同定効率をプロトコール改良前後で比較評価して、プロトコ

ールをブリッジングできるようにすることも可能だろう。例えば、どの DNA 抽出プロト

コールでも容易に回収できる細菌を利用することで、菌の存在量がプロトコール間で比較

できるように情報科学的に収集データを変換するなどの取り組みなどが可能だろう。ただ、

DNA 抽出方法やシークエンサーそして情報学的なパイプラインなどの条件の違いをブリ

ッジングするとなると大規模になるが、標準化はそういう過程を経ると思われる。

4.健常な日本人の細菌叢パターン

プロトコールを標準化した後は、欧米がそうであったように、創薬利用を想定して健常

な日本人の細菌叢パターンを決定する研究がなされる予定である。山田准教授らは、欧州

の MetaHIT というプログラムで採用されているプロトコールを採用して、日本人 650 人

の腸内細菌叢のメタゲノム解析を実施している。約 5,000 人分の腸内細菌叢を解析すれば、

日本人の平均パターンが分かることを想定している。

最近、欧州におけるプロジェクトの発表がなされたが、そこでは 3,948 人の解析をして、

細菌叢パターンを決定している(LifeLines-DEEP)1)。このとからも、5,000 人という数

字は妥当性があると思われる。また、同一人物の追跡調査も重要である。例えば、5,000

人の腸内細菌叢を 10 年くらい追跡調査すれば日本人の腸内環境がどのような基盤で機能

しているかが分かり、創薬研究も加速すると思われる。

5.細菌叢のメタゲノムシークエンス解析の状況

菌叢全体のゲノム解析をするのがショットガンメタゲノム配列解析である。メタゲノム

解析の場合、サンプル中に様々な菌由来のゲノムが混在しており、近交種の菌由来の似た

遺伝子配列が混在している場合は、シークエンサーで得られるリードを正確にアセンブリ

させることが出来ないなどの問題が考えられる。また、サンプルにはヒト遺伝子が入り込

む場合がある。このようなヒト由来遺伝子配列はデータ解析時に排除できるため、新規の

配列が同定されるといった問題はない。

Page 120: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 113 -

コンピュータ上で繋ぎ合わせた細菌遺伝子配列を既存の細菌ゲノムデータベース(リフ

ァレンスゲノム)にマッピングすると、半数がマッピングされるが、残りはマッピングさ

れずに残ってしまう。これは、これまでにゲノム解析がなされていない菌が多数存在する

ことに起因する。マッピング率を向上するためにはリファレンスゲノムのデータベースを

強化することが望まれる。

また、現在、何人の糞便サンプルに対してメタゲノム解析を行うと、ヒト腸内細菌遺伝

子のリファレンスデータを得ることができるかを議論しているが、その数を決めるのは非

常に難しい。例えば、レアファクションカーブという考え方がある。100 人分の腸内細菌

メタゲノム解析をすると大体 200 万遺伝子が同定され、200 人からだと 400 万遺伝子、500

人からだと 1,000 万遺伝子が同定される。十分なサンプル数を解析すれば、通常得られる

遺伝子数は増えなくなるので、これでヒト腸内細菌遺伝子リファレンスデータベースを構

築できたと考えることができる。しかしながら、これまでに 500 人のサンプルを解析した

結果、約 1,000 万遺伝子が同定され、約 500 万遺伝子が多くの人に共通して存在する遺伝

子であった一方、残りの約 500 万遺伝子に関しては、1 個人しか持っていない固有の遺伝

子であることが判った。つまり、個人に特異的な遺伝子が腸内環境の半分以上を占めてい

るという状態である。1 個人には約 100 万程度の腸内細菌の遺伝子があり、そのほとんど

が他者と共通しているが、約 1 万の自分自身にしかない遺伝子が存在する(500 万遺伝子

/500 人=1 万遺伝子/人)。細菌叢全体の遺伝子数からすると個人にのみ存在する遺伝子は

少数であるが、多数の人で見ると固有の遺伝子が膨大に存在する。また、ヒトゲノムの遺

伝子数が約 25,000 程度であることを考えると、腸内細菌叢では非常に多くの固有の遺伝

子が働いていることになる。これが腸内細菌叢の特徴である。個人のユニークな遺伝子は

永遠に無くならないと予想されることから、5,000 人の菌叢解析をしても、得られる遺伝

子数は増え続けるため、どこまで行けば、ゲノムデータベースとして十分と言えるのかは

現在も議論が続いている。

6. ビッグデータとしての腸内細菌関連データの統合データベース構築を巡る動き

東京工業大学では、国立がん研究センターおよび慶應義塾大学と協力し、国立がんセン

ターの内視鏡検査の受検者を対象に糞便を採取、メタゲノム解析とメタボローム解析を実

施し、腸内環境のデータベースを構築している2)。これまでに、約 1,000 人の健常者と約

800 人のがん患者のサンプルを取得しており、約 650 人の解析を実施済みである。また、

被験者は約 1 時間から 2 時間程度を要する生活習慣に関するアンケートに答えることにな

っており、その結果もデータベースに登録している。つまり、上記データベースは個人の

生活習慣と細菌叢ゲノム・代謝産物と疾患情報が統合されたデータベースであり、疾患関

連情報を抽出できる非常に魅力的なものとなっている。ヒトゲノムに関しては上記データ

ベースに登録してはいないが、将来的にヒトゲノム情報を追加することを想定して検体を

保存している。ヒトゲノム解析には膨大なコストがかかるため、現時点では手を付けられ

ていないが、本来、疾患関連性を明らかにするためには、宿主側(ヒト)のゲノムデータ

やトランスクリプトームデータと統合的に解析することが望ましく、必要な研究費を投じ

る必要がある。

また、腸内細菌叢の代謝マップの構築を精力的に進めている。東京工業大学では一般個

Page 121: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 114 -

人や企業からの寄付金によって「日本人腸内環境の全容解明とその産業応用プラットフォ

ーム」、Japanese Consortium for Human Microbiome(JCHM)という枠組みを作り(図

1)3)、積極的に技術移転を行っている。この資金を利用し、前述の代謝マップの構築も進

められている。

図1.JCHM の組織体制

(JCHM のホームページより)

代謝マップの作成にあたっては、得られたメタゲノムデータとメタボロームデータを基

に計算機的に自動でマップを作るのではなく、これまでに論文報告のあった腸内細菌によ

る代謝経路やその酵素遺伝子をアサインしていくという地道な作業をしている。

動脈硬化やがんのような、様々な疾患に関係するような腸内細菌叢由来の代謝物質はい

くつか論文報告がなされているが、その代謝経路が分かっていないものも数多くある。そ

のような代謝経路はマイクロバイオーム創薬の基点になる可能性がある。代謝マップ研究

に関しては海外からも論文が出てきているが、網羅性が低いことや、パスウェイ上で埋ま

っていない遺伝子があるなど、不十分な状態である。日本では代謝パスウェイデータベー

ス・KEGG(Kyoto Encyclopedia of Genes and Genomes)を長年にわたって研究してき

た実績とノウハウがあり、それが海外との差別化ポイントである。腸内細菌研究で後れを

取っている日本に勝ち目があるのは、腸内細菌の代謝マップを作成し、創薬応用する研究

だと思われる。

代謝マップ作成に関しては、地道な論文からの抽出作業が必要である。将来的には論文

からのテキストマイニングがより精度が高くなり、代謝経路構築をサポートする人工知能

(AI)が登場することも予想される。腸内細菌叢と疾患の関連性に関しては多くの論文が

発表されるようになったが、論文間で整合性が無いケースが多数あり、整理が必要な状況

である。膨大な情報を人力で整理するのは難しいので、テキストマイニング技術を利用し

て、読むべき論文を大まかに抽出するような、キュレーションの補助的な AI 開発が進む

であろう。ただし、現時点ではそのような AI は存在しないので、人が論文を理解し、代

謝経路としての妥当性を検証し、クオリティーの高い情報を代謝マップに登録している。

このことにより、非常に質の高い代謝マップの構築を行っている。

7.近未来の腸内細菌が関連する医療・創薬に関して

将来的には、腸内細菌叢をコントロールし、デザインする治療や先制医療が考えられる。

ただ、前述のように、健常な細菌叢を詳細に定義できていないので、どのように腸内細菌

Page 122: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 115 -

叢をコントロールすべきなのかについては、まだ分かっていない。体温に関しては、高熱

となれば下げるという明確な指針があるが、マイクロバイオームの場合はどの方向に動か

すべきかは、人によっても、人の状態によっても違う。そして、細菌叢は菌が相互依存し

ているので、この菌が多い時には Bacteroides は下げるべきではないなど、かなり複雑な

要素まで考える必要がある。それを理解するためには、個人の細菌叢データを継時的に蓄

積するのが望ましい。長期間にわたり同一人物のデータをとり、どういう時にどのような

腸内細菌ネットワークが変動し、疾患を誘発するのかを理解できれば、腸内細菌叢をコン

トロールする医療ならびに腸内細菌叢を起点とした創薬が実現性を帯びてくる。

一方で、上記を実現するには課題もある。病気に罹患した際に増減する菌が、病気の原

因なのか結果なのかを結論するのが難しいのである。現状ではマウスを利用した評価系を

用いることが多い。しかしながら、ヒトと腸内環境が大きく異なるので、どのようにヒト

に該当するのか知恵を絞らなければならない。例えば、無菌マウスに特定の菌を移植して

ノトバイオートを作成し、マウスが疾患症状を呈すれば、疾患の原因菌の一つとして認定

できるが、治療ターゲットとして有望な菌と断定することはできない。臨床では、膨大な

菌の集合体として病気を発症しており、ノトバイオートのように特定の菌のみが存在する

条件下の結果ではない。つまり、ある菌 A を創薬ターゲットだと考えて創薬研究を実施し

ていたが、実は、菌 A が増えることによって誘導される別の菌 B が本来の治療ターゲット

ということもあり得る。in vitro 評価系も無い訳ではなく、腸管モデルの作成が進んでい

るが、本当にその方法で十分にヒト腸管を再現できているかについては、まだ未知な部分

が多い。

上記のように、現時点において非臨床研究では疾患メカニズムを結論するのは難しいの

で、臨床研究に頼らざるを得ない。つまり効率的に創薬を進めるためには、どのような臨

床研究をデザインするかを研究者が考えなければいけない。自閉症、肥満そして糖尿病な

どの、いくつかの疾患に関しては、腸内細菌叢との関連性が高いことが判ってきているの

で、臨床研究を実施すべきだと思われる。特に自閉症は比較的わかりやすい疾患だろう。

自閉症では妊婦の腸内細菌叢の影響が出て、子供が自閉症を呈するようになることが判っ

ている。妊婦の腸内細菌叢をコントロールして、子供の自閉症との相関解析をするのであ

れば、長い年月がかかって進行する慢性疾患よりは、手を付けやすいと思われる。

また、創薬の観点から考察すると、現行の薬剤が腸内細菌に影響を及ぼし、その結果と

して薬理効果・副作用を出している可能性がある。医薬品が腸内細菌に与える影響の定量

化法の構築が必要だと思われる。既に欧米では、さまざまな菌株に対して医薬品を作用さ

せ、分裂速度などのフェノタイプがどのように変化したか、薬がどのように代謝されたか

を時系列評価する取組みがなされている。腸内細菌叢はヒトによってタイプが異なるので、

上記の取組みにより、個々人に対する薬効や副作用の予測性の向上に繋がる可能性がある。

8. 執筆担当者所感

ヒトの腸内細菌叢には 1,000 万もの遺伝子が存在し、食物を代謝しヒトにとって重要な

栄養素等を作っている。このことから、欧米では腸内細菌叢を新しい臓器として認識し、

2008 年頃から大型予算を投じ、その機能解明と新規創薬ターゲットの同定研究が進められ

ている。一方、日本ではそのような新しい臓器が見つかったという認識が無かったため、

Page 123: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 116 -

それが、マイクロバイオーム研究に出遅れた要因だと欧米の研究者が言っている。現在で

は、病院に行った際に、脈や心電図を測定するが、それはヒトの中に心臓があり、心臓の

不調が疾患とかかわることが分かっているので、そういった検査がなされている。将来、

腸内細菌叢と疾患の関わりが明らかとなり、疾患の有無がメタゲノムやメタボローム解析

から診断できるようになれば、健康診断の検査項目に腸内細菌検査が加わり、腸内細菌が

臓器として認識されるようになるだろう。

そもそも、ヒトを構成する真核細胞自体、バクテリアが進化してできたものであり、ヒ

ト自体、極論するといろいろなバクテリアの共生体と言って良いと思う。共生している腸

内細菌叢はヒトというシステムの構成部品であり、臓器として調べる必要があると強く思

う。今後は、腸内細菌叢という臓器から多くの創薬ターゲットも見つかってくるのではな

いだろうか。

腸内細菌叢を起点とした創薬を考えると、代謝マップの構築が基盤となる。また、代謝

マップの作成に関しては、日本がノウハウを持つ領域であり、本研究の推進は間違いなく

国益に繋がることから、腸内細菌研究活性化に向け、国・行政にはより一層のサポートを

お願いしたい。WMS 解析、メタボローム解析を実施した上で、腸内細菌叢の代謝マップ

を構築するには資金が必要である。数千検体を解析するためには、それ相応の資金が必要

である。是非、資金的なサポート強化をお願いしたい。

また、異なる研究機関のデータを比較できるようにすることも重要である。そのために

はプロトコール標準化が必要である。欧米でも標準化を進めているが、一致団結して進め

ようという動きにはなっていないようである。マイクロバイオームを起点とした創薬研究

において、日本が欧米にキャッチアップし、追い越すためには、標準化を取り仕切る人材

を選抜し、関係する研究者が動きやすい協力体制をひとつの枠組みの中で作り、強力にマ

イクロバイオーム研究を推進することが資金強化とともに必要だと考える。サポート期間

としては、個々人のマイクロバイオーム変化を追っていく必要があるため、10 年間程度の

国の支援が必要だと思う。これが実現できないと欧米には勝てないだろう。

参考文献

1) A. Zhernakova, et al., Science 352, 565–569 (2016).

2) 東京工業大学ホームページ 東工大ニュース 2016 年 7 月 13 日;「腸内細菌叢(腸

内フローラ)のメタゲノム解析による発がん研究の加速に期待」

http://www.titech.ac.jp/news/2016/035713.html

3) JCHM ホームページ; http://www.jchm.jp/

Page 124: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 117 -

第4節 人工知能の創薬への利活用

はじめに

近年、医療分野に限らず、人工知能(artificial intelligence、AI)の応用研究は急速に

進んでいる。しかしながら、AI は決して新しいものではなく、従来の機械学習による AI

は現在まであらゆる分野で活用されてきている。近年注目される背景には、学習データ量

の向上、深層学習の進歩、画像識別能力の向上、など様々な技術革新があったと言える。

ビッグデータの情報化社会において、人間ではできない分析もあり、それをより効率的に

解決する上で、AI は欠かせないものとなっている。また、医薬品開発においては、標的分

子の枯渇がという課題があり、多くの医療情報、オミックス情報からの創薬シーズ探索に

も AI の活用が期待されている。しかしながら、AI は、あくまで人間の判断をサポートす

るものであり、それを活用するのも人間である。そのため、AI の活用の可能性と課題を良

く理解する必要がある。このような背景の中で、本節では、医療分野における AI の活用

の現状と創薬への応用の可能性に関し、医療分野において成果を挙げつつある AI の代表

例である IBM の Watson について創薬への応用も含めて開発元の日本アイ・ビー・エム株

式会社に、また、医療への活用事例として東京大学医科学研究所の宮野教授にヒアリング

を行った。さらに、今後の創薬研究における AI の可能性について、生命科学と情報科学

の両分野に精通している医薬基盤研究所、水口賢司プロジェクトリーダーにヒアリングを

実施し、その可能性と克服すべき課題と取り組みについて概説した。

Page 125: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 118 -

第4節関連ヒアリング先とヒアリング概要

ヒアリング先 概要

1

日本アイ・ビー・エム株式会社

ワトソン事業部

ヘルスケア事業開発部

川口 克己 部長 他

「IBM Watson の医療および創薬への活用」

IBMは Watsonを開発し、医療向けに Watson Health

というソリューションを提供している。日々生み出さ

れて共有される膨大な量の個人の医療情報や健康情

報から洞察を引き出すことにより、医師や研究者を支

援するシステムである。クラウド環境上で患者情報を

共有し、対話から学習を繰り返し、時間とともに価値

と知識を増やしていく。AI ブームの中、なぜ、Watson

が注目されているのか、医療・創薬への可能性につい

て解説。

2

医薬基盤・健康・栄養研究所

バイオインフォマティクス

プロジェクト

水口 賢司

プロジェクトリーダー

「創薬への人工知能(AI)の活用:医薬基盤研での

取組み」

製薬企業や各研究機関などでは、創薬における新薬開

発の莫大な開発費用の削減と開発期間の短縮のため、

AI を活用する取組みが始められている。公的機関な

動きとしては文部科学省、経済産業省、総務省、厚生

労働省などで AI の産業への活用を前提とした取り組

みが始まっている。ビッグデータを用いた創薬研究に

ついての課題ならびに今後の取り組み、AI の活用に

ついて解説。

3

東京大学医科学研究所

ヒトゲノム解析センター

宮野 悟 教授(センター長)

「ゲノム解析の今後の鍵となる基盤技術である人工

知能について、人工知能研究の現状並びに将来への課

題」がんの診断は遺伝子を網羅的に解析し、がんの変

異に適した治療薬を選択する時代に入りつつある。

IBM の人工知能“Watson”を用いて、ゲノムデータ

からがん遺伝子を特定し、膨大な文献情報から治療方

針の選択を行う研究が展開されており、新しい医療技

術として今後の研究成果が期待される。AI を用いた

医療への応用について、癌領域を中心にその可能性と

現状について解説。

Page 126: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 119 -

〔1〕 IBM Watson の医療及び創薬への活用

ヒアリング先:

日本アイ・ビー・エム株式会社

ワトソン事業部ヘルスケア事業開発部 川口 克己 部長

溝上 敏文 部長

ソフトウェア&システム開発研究所

第二ワトソンサービス 徳増 玲太郎 氏

要旨

人工知能やスーパーコンピュータの利用により、ライフサイエンスやヘルスケアは大き

く変化しつつある。IBMはコグニティブ・コンピューティングとしてWatsonを開発した。

Watson の特徴の 1 つは、自然言語処理である。自然言語で記述された非構造化データを

大量に読み込み、コーパスと呼ばれる知識ベースを構築し、コンピュータが処理を得意と

する構造化データへの変換を行う。これによってビッグデータ解析が可能となり、自然言

語で記述された文章を解析し、与えられた問題に対する回答を得ることができる。さらに、

機械学習を取り入れることによって、回答の精度を向上させることが可能となっている。

すなわち、Watson は習得した知識に基づく応答と、その応答に関連するエビデンス情報

に基づく信頼スコアを決定する質問応答システムであり、人間の意思決定を支援する高性

能な意思決定支援システムである。

Watson を医療・ヘルスケア分野で事業化したのが Watson Health であり、Watson for

Oncology、Watson for Genomics、Watson for Drug Discovery 等に代表されるソリュー

ションが商用提供されている。Watson Health は、日々生み出されて共有される膨大な量

の個人の医療情報や健康情報から洞察を引き出すことにより、医師や研究者を支援するシ

ステムである。クラウド環境上で患者情報を共有し、対話から学習を繰り返し、時間とと

もに価値と知識を増やしていく。これによってデータからエビデンスに基づいた回答を出

すことが可能となる。ただし、出力されたレポートに基づいて治療方針を決定するには医

師の知識や経験などが必要なため、Watson Health はそれ自体が診断を下すのではなく、

医師をサポートすると位置付けている。

1.はじめに:がん診療における人工知能利用

近年、様々な分野で人工知能の活用が進んでいる。医療・ヘルスケア分野における人工

知能の活用が一躍有名になったのは、IBM の Watson によるがん診断支援である1)。米国

においては、Memorial Sloan Kettering Cancer Center などの大規模ながん専門病院で採

用され始めた。日本では 2015 年 7 月より東京大学医科学研究所において Watson による

がん診断支援の研究が開始された。この研究では、患者がん組織においてゲノム上のがん

関連遺伝子の塩基配列を解読し、その配列データを Watson に入力して解析を行った。具

体的には、あらかじめ、臨床情報をはじめ、論文や特許文献などから得たがん関連の変異

についてトレーニングを行った Watson が、それらを参照しながら、入力された遺伝子配

列データからがんの発症や進行に関係している可能性のある遺伝子変異を見つけ出し、得

Page 127: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 120 -

られた結果を根拠となるデータや治療薬の候補と一緒に提示するものである。

発表によると、同研究所分子療法分野では 2015 年 7 月以降、血液がん患者ら 71 人、延

べ約 100 症例で遺伝子情報を入力し、診断支援に活用した。2015 年 3 月までの 54 人で分

析すると、30 人で診断や病態の解釈に役立つ情報を提示した。他の 11 人でも治療方針の

参考になり、合計で 8 割近くの患者で有用な情報が得られたことになる2)。

2.Cognitive System としての Watson

IBM Watson は、クラウドを通じて提供される世界初の商用コグニティブ・コンピュー

ティングである3)4)。Watson という名称は IBM の創立者である Thomas John Watson

にちなむものであり、創業 100 周年事業として IBM の基礎研究部門が 2006 年から 4 年の

月日をかけて開発した。Watson は、いわゆるプログラムレスのコンピュータであり、プ

ログラムを組まなくても、大量のデータを投入すればそこから最適な回答を導き出すこと

が可能となっている。従来の汎用コンピュータとは全くアーキテクチャの異なるコンピュ

ータで、自然言語で投げかけられた質問を理解し、大量のデータを分析し、根拠に基づい

た回答を提案するものである。Watson の能力は、2011 年 2 月にテレビの長寿人気クイズ

番組 Jeopardy! で歴代最強のチャンピオン回答者 2 人に打ち勝つことによって、一躍有名

になった。大きさは冷蔵庫 10 台分程度であり、それほど大きなものではない。処理能力

は約 80 テラ FLOPS(1 秒間に 80 兆回)で、これは 2014 年時点で世界一の性能を持つと

される中国のスーパーコンピュータ「天河二号」の実測値である 33.86 ペタ FLOPS(1

秒間に 3 京 3860 兆回)に比べて約 400 分の 1 であり、コンピュータとして最新の性能を

要するものではない。

Watson は既に銀行のコールセンターや接客、保険金支払い審査、人材マッチングなど、

様々な分野で利用されている(図 1)3)。Watson が質問から解答を導き出す作業は、以下

のようなステップに従って行われる(図 2)。まず、自然言語処理により文脈を理解し、質

問の内容を解析する。次に、質問内容に基づいて情報源を検索し、解答と根拠を抽出する。

最後に、信頼度スコアの計算を行い、順位付けを行い、エビンデンスを提案する。この作

業を支えるのが、自然言語処理技術と統計処理的推論技術である。これらの技術によって、

言葉を理解したり文章を読んだりして、文脈を理解することが可能となる。そして、情報

源から規則性を見出し、解答と根拠を抽出することが可能となる。さらに、これに機械学

習技術を加えることによって、経験を積み重ねるとともに解答の精度が上がっていく。こ

れらの 3 つの技術をパッケージにしたものが Watson である。IBM では Watson を「人工

知能」ではなく「Cognitive System」という名称で呼んでいる。

Page 128: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 121 -

図1.IBM Watson が手掛ける事業領域

(日本アイ・ビー・エム提供資料)

図2.IBM Watson が回答を導き出す手順

(日本アイ・ビー・エム提供資料)

先に述べたように、Watson の大きな特徴は、自然言語処理である。コンピュータでは

構造化されたデータを処理できるが、文章や画像などの構造化されていないデータを扱う

ことができない。したがって、コンピュータで処理するためには、言語データを構造化す

る必要がある。Watson では、自然言語で記述された情報である非構造化データを大量に

読み込み、コーパスと呼ばれる知識ベースを構築し、コンピュータが処理を得意とする構

造化データへの変換を行っている。構造を持ったコーパスを作成することによりビッグデ

ータ解析が可能となり、システムが自然言語で記述された文章を解析し、洞察を得られる

ようにしている。

このような自然言語処理や機械学習のアルゴリズムは、何十年も前からアカデミアで研究さ

Page 129: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 122 -

れてきたものであり、それ自体が特に目新しいというわけではない。それが最近になって人工知能

として脚光を浴びているのは、システムの性能が上がってきたという理由もあるが、以前に比べて

デジタル化された状態のデータが大量に存在することによる。デジタル化されているデータとは、

自然言語で記述されている論文や画像などである。画像データは、情報処理的な観点からは、

「0」、「1」という数字の羅列であり、それをモニター上で画像という形にして提示すると人間は画像

として認識する。したがって、情報処理的には自然言語処理と同等な処理が可能であり、それをコ

ンピュータがあたかも画像を見て、そこに何が描かれているのかを判断しているかのように振る舞

わせることが可能となっている。

ちなみに、AIの明確な定義は存在せず、一般社団法人人工知能学会では、「大量の知識デー

タに対して、高度な推論を的確に行うことを目指したもの」と学会設立趣意書に記している。一般

的には、人工知能として「AI(artificial intelligence)」という単語が使われているが、IBM では

「AI」を「augmented intelligence」の略号と考えている。すなわち、人間の能力を増強する

(augment)ものとしてAIを位置付けており、人間が見たり読んだりできる情報をスケールアップす

るが、あくまでも判断を行うのは人間であるという思想である。

3.Watson Healthcare:医療・ヘルスケア分野における Watson 利用

2015年4月、IBMはWatsonの医療・ヘルスケア関連における応用としてWatson Health

事業を発足し、Watson Health Cloud プラットフォームを発表した(図 3)。このプラット

フォームは、日々生み出されて共有される膨大な量の医療情報や健康情報から洞察を引き

出すことにより、医師や研究者などを支援するものである。Watson Health Cloud では、

患者情報を共有し、対話から学習を繰り返し、時間とともに価値と知識を増やしていく。

これを用いれば、データからエビデンスに基づいて回答を出すことが可能となる。システ

ムはクラウド環境で提供されるため、世界中からアクセスすることが可能である。この環

境を用いることにより、世界中から大量のデータを集め、機械学習によって特徴量を抽出

し、それを用いて解析を行うことが可能となっている。Watson Health では、下記の代表

的なソリューションが提供されている。

・Watson for Oncology

・Watson for Genomics

・Watson for Drug Discovery

以下、それぞれについて詳細を説明する。

Page 130: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 123 -

図3.IBM Watson Health プラットフォームの全体像

(日本アイ・ビー・エム提供資料)

(1)Watson for Oncology

Watson for Oncology は、がんの診断支援を行うシステムである1)。基本的にはがん診

療に関する National Comprehensive Cancer Network(NCCN)のガイドラインに基づ

いて判断を行う。ただし、NCCN ガイドラインだけでなく、開発に携わった医師の経験な

ども加味して判断するようになっており、そこに独自性が発揮される。診断支援に用いる

データは、主に電子カルテに記載された診察データで、既往症歴や家族病歴なども加えて

判断を行い、医師の判断をサポートしていく。その際に、判断する上で重み付けの大きい

質問から順番に入力を促される。入力情報が多くない場合には回答の確信度が低下する。

なお、Watson 自身が診断を行うのではなく、飽くまでも診断のサポートを行うものであ

り、治療法の候補とその根拠となるエビデンスを示し、それに基づいて医師が判断を下す

ものである。Watson for Oncology の開発には Memorial Sloan Kettering Cancer Center

の医師が参加しており、Watson はその標準治療に基づいて、治療法の候補として

「Recommendation」・「Consideration」・「Not recommend」などの候補を示す。その際

に、エビデンスとしての論文や治療薬の添付文書に基づく副作用情報などを提示する。

今後、適用できるがん種などを拡大し、がん領域での利用を広げていくためには、電子

カルテのデータ解析が必要である。医学分野はオントロジーが整っているので、AI にとっ

て比較的取り組みやすい分野であり、特に英語に関してはオントロジーが整備されている。

また、画像データに関しては、Watson Health Imaging というソリューションを開発中で

ある。

知的財産という観点からみた場合、顧客が新しく教え込んだ領域は、顧客が知的所有権

を有する。例えば、がん診断の場合、AI のトレーニングを行ったがん専門病院が知的所有

権を有し、IBM がその成果を使用する場合には、IBM が使用料を払う。

Watson for Oncology は、医療サポートシステムとして、既にタイの Bumrungrad 国際

病院やインドの Manipal 病院で利用されている。このシステムが最初に売れたのがタイで

Page 131: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 124 -

あるが、欧米からの医療ツーリズムなどで利用されている。すなわち、タイの医師が下した

診断結果について、Memorial Sloan Kettering Cancer Center の医師によるセカンドオピニオ

ンとして意味があることを示し、論文などのエビデンスを提示すことによって医療の価値を増大させ

ている。また、がん治療で先進的な米国における知識の集約によって作られた本システムが、がん

専門医の少ないインドや中国、韓国、オランダなど世界各国の病院において利用されはじめてお

り、世界で医療に貢献している。

(2)Watson for Genomics

近年、がん組織のゲノム解析が進展するに従って、ゲノム情報に基づく診断と治療方針

の決定が行われるようになってきた。このような傾向は更に進み、近い将来には多くのが

ん診断でゲノム解析が用いられるようになると考えられる。がんゲノム診断が普及するに

つれて下記のような課題が生じてきた。

・診断には迅速性を要するが、レポート作成に時間を要する。

・解析担当者によってレポート内容が異なる。

・多数の患者のデータを処理する必要がある。

・ゲノム変異と対応する治療薬の選択に当たっては、最新データを用いる必要があるが、

膨大なデータが蓄積され、個々の解析担当者が対応することが困難になっている。

このような課題を解決するために、人工知能によるデータ解析が行われるようになり、

徐々に威力を発揮し始めている。その代表的なものが、IBM で開発された Watson for

Genomics である5)。Watson for Genomics では、がん細胞のゲノムデータを入力すると、

解析を行い、レポートを出力する。ゲノム配列データから変異の解釈を行い、がんに関連

するドライバー変異を見出し、変異データに基づき処方可能な治療薬を報告するものであ

る。同時に、関連するパスウェイを表示し、変異そのものに対応する治療薬が存在しなく

ても、パスウェイ上の別の分子を標的にした治療薬を選択することが可能となる。最終的

には、これらのレポートに基づいて医師が治療法を決定する。本章の冒頭で述べた東京大

学医科学研究所の成果は、この Watson for Genomics を用いたものである。

医師によるレポート結果と Watson for Genomics のレポート結果を比較したところ、両

者で共通して挙げられた治療薬以外に、Watson for Genomics のみが挙げた治療候補薬が

存在し、Watson for Genomics が医師よりも幅広く治療薬候補を見出す可能性が示された。

一方で医師のみが挙げた治療候補薬も存在し、学習に基づく人工知能は万能ではないこと

も示唆されている。一部には人工知能が医師に成り替わって診断を行うようなイメージが

広がっているが、Watson for Genomics はあくまでも医師をサポートするシステムであり、

Watson for Genomics のレポートに基づいて最終的な診断を下すのは医師でなければなら

ない。治療方針を決定するためには、単に Watson による解析だけでなく、医師の知識や

経験なども必須となるからだ。

(3)Watson for Drug Discovery

Watson for Drug Discovery は、Watson の創薬向けソリューションであり、創薬ターゲ

ットとなる治療対象分子を見つけること等を目的としている6)。日本でも導入され、創薬

における利用が始まっている。Watson for Drug Discovery では、文献などのデータを読

Page 132: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 125 -

み込んで、これまでに知られていない新たな可能性を提示するものである。すなわち、ど

の論文にも書かれていない新たな関係性を導き出して仮説として提示する。提示された仮

説に対しては、実際に実験を行うことによって検証を行う必要がある。Watson では、膨

大な医学論文をコーパス処理した文章データを機械学習にかけ、知識体系を構築し、それ

を利用して疾患や医薬品との生化学的な関連性を見出すことになる。例えば、タンパク質

間相互作用や遺伝子とタンパク質との関係性、タンパク質とそのリン酸化酵素との関係性

などであり、そうした情報を大量に扱いながらターゲットになる可能性のある候補化合物

を提示する。

Spangler らによると、ベイラー医科大学の研究チームは、Watson for Drug Discovery

のシステムを用いて p53 を活性化するリン酸化酵素を新たに 7 つ発見した7)。これは、膨

大な数の論文によって形成される知識空間の全体像を一望し、そこから新たな発見を行う

ものである。人間は知識空間を断片的にしか捉えられないが、Watson によるビッグデー

タ解析によって新たな創薬ターゲットの発見が期待される。

上記 3 つのアプリケーション以外に、モバイル機器を用いる臨床研究において Apple と

協業し、ResearchKit の利用も進めている8)。

4.Watson 利用のためのデータ整備

先に述べたように、Watson による解析を行うためには、膨大な量の良質なデータを必

要とする。したがって、ヘルスケア分野で事業を立ち上げるに当たって、IBM はデータを

所有している企業を買収し、データを入手することから始めている。まず、2015 年に

Explorys を買収した9)。この会社は北米に限られるが匿名化された 5,000 万人分の医療情

報や電子カルテ情報をクラウド上で管理している。次に、Merge Healthcare を買収した1

0)。この会社は医療画像のクラウドサービスを行っており、2 億枚の医療画像を所有して

いる。さらに、医学出版会社より学術雑誌に掲載された論文やガイドラインなどの使用権

を入手し、IBM がデータを使える環境を構築した。(図 4)。

医学領域では英語文献などに関して膨大なデータがあるがん診断が、Watson による解

析に適した領域の 1 つとなる。がん関連の論文が毎年 20 万件ほど PubMed に登録されて

いるが、Watson は毎秒数億ページに相当するデータ読み込みが可能なので、適時に

Watson で解析することが可能である。さらに、Memorial Sloan Kettering Cancer Center

や New York Genome Center などの専門家の協力を得て、論文の知見を実際の医療にどの

ように役立てるかをトレーニングしている。このような作業を、開発段階だけでなく、実

際の運用を行いながら続けることによって予測精度を高めている。IBM のビジネスとして

は、プラットフォームと IBM が使用権を有するデータを提供し、顧客の仮説を検証する

ためのデータサイエンティストの支援を行っている。これらを用いて顧客が新たなデータ

を学習させた場合には、その部分の知的財産は顧客が所有するものとなる。

Page 133: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 126 -

図4.IBM Watson Health におけるデータ利用と学習

(日本アイ・ビー・エム提供資料)

実際に使用するデータに関しては、専門用語は業界ごとに異なっており、業界内のサブドメイン

でも異なっていることがあり、データが体系だった形で整理が必要となる。自然言語処理の上で障

害となるのが文章の揺らぎであるが、この揺らぎを軽減させるための方法の 1つが、辞書や類義語

(シソーラス)といった知識ベースを用いることである。これによって専門的な単語や関係性を文章

から抽出することが可能となる。医療分野においては、米国 NIH の National Library of

Medicine(NLM、国立医学図書館)が Unified Medical Language System(UMLS)と呼ばれ

るデータベースの整備を進めている11)。UMLS では研究や診療、創薬などで使用される専門的

な医学用語が網羅的に体系化されており、オントロジーやシソーラスなどが階層構造になって整

備されている。生命科学やヘルスケアの用語のコンピュータによる理解の助けとなっており、

Watson の医療分野での利用においてもコーパス作成時に UMLS を参照している。日本語の専

門用語に関しては、整備状況は英語環境に比べるとやや遅れている。NPO 法人医学中央雑誌

刊行会や東京大学の臨床医学連結知識データベース LiLak などのシステムがあり、オントロジー

やシソーラスなどの情報整備が人工知能システムの開発を助けている12) ~14)。

5.日本における医療・ヘルスケアソリューション提供

日本における医療・ヘルスケアソリューションとしては、大塚デジタルヘルス株式会社

が Watson 技術を使ってヘルスケア情報サービス事業を行い、医療の質向上に貢献するよ

うなソリューションを提供している。大塚デジタルヘルス株式会社は、大塚製薬株式会社

が 2016 年 6 月に日本 IBM との合弁会社として設立したものである。大塚製薬が培ってき

た中枢神経領域の専門知識や経験をベースに、IBM Watson を活用した精神疾患に関する

データ分析ソリューション「MENTAT」の開発・販売を行っている15)。精神科医療では

患者の症状や病歴などが電子カルテなどに自由記述で入力されて蓄積されている。重要な

医療情報の多くが数値化されておらず、従来の技術では膨大な情報を統合・分析したデー

タベース化が困難であった。そのために、その膨大なデータが臨床現場では十分に活用さ

Page 134: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 127 -

れていなかった。MENTAT は、Watson の技術によってこの課題の解決を図るものである。

すなわち、膨大なテキストデータを自動的にデータベース化することで、医療従事者が患

者の医療データを有効に活用し、有用性の高い情報を共有し、医療上の課題に対するソリ

ューションを提供する。例えば、医療従事者は参照したい症例を絞り込んで抽出すること

が可能となり、エビデンス情報を共有したり治療に反映したりすることによって治療結果

の向上に繋がることが期待される。また、電子カルテデータを分析することにより、過去

の患者の治療例との類似性などに基づいて治療の難易度を予測し、治療法の選択や患者の

ケアを行うことが可能となる。さらに、入院期間や退院後の再入院の確率などを予測する

ことによって、重篤な患者と軽症の患者との医療リソースの配分などを行うことが可能と

なる。

上記の他には、藤田保健衛生大学病院が、第一生命保険株式会社とともに、2004 年以降

の患者約 98 万人分の検査データやカルテに記載された症状や病歴などを Watson 技術を

用いて分析し、糖尿病患者の傾向を見つけだすという取り組みを始めている。

6.がんゲノム解析における Illumina との提携

2017 年 1 月に IBM Watson と Illumina との提携が発表された。これは、Watson for

Genomics を Illumina の BaseSpace Sequence Hub 及びがんゲノムシーケンスプロセス

に統合することにより、ゲノムデータ解釈の標準化と簡略化を支援することを目的として

いる。すなわち、Illumina のシークエンサーと IBM Watson によるデータ解析とをダイ

レクトに結びつけようという試みである。

Illumina の TruSight Tumor 170 は、固形がんプロファイリングパネルで、ホームペー

ジ情報によると 170種の遺伝子から一連の包括的な変異を検出できるように設計されてい

る16)。Watson for Genomics を Illumina のシークエンスプラットフォームに結び付ける

ことにより、TruSight Tumor 170 で生成された幅広い変異データの解釈に役立つ情報に

迅速にアクセスできるようになる。すなわち、Watson for Genomics は、TruSight Tumor

170 が生成したゲノムの変異に関するファイルを読み込み、専門ガイドラインや医学文献、

臨床試験等の知識源を精査して、それぞれの変異に関する情報を提供し、研究者が利用で

きるようにレポートを出力するのである。このように、Illumina のシークエンサーによる

がんゲノム解読と Watson for Genomics による解釈とが結び付くことによって、がん治療

におけるゲノムデータ解析が迅速化し、precision medicine の実現へと繋がることが期待

される。

7.執筆担当者所感

2016 年 11 月に政府が開いた第 2 回未来投資会議で、安倍晋三首相が「ビッグデータや

人工知能を最大限活用し、予防・健康管理や遠隔診療を進め、質の高い医療を実現してい

く」と宣言した。それを受けて、厚生労働省は、診療報酬改定により人工知能を用いた診

療支援にインセンティブを付ける方針を表明し、「2018 年度の診療報酬・介護報酬改定に

向けて、診療支援技術の確立と報酬の付け方について議論を重ね、2020 年度までに実装化

へと進める」と説明した。今後医療における人工知能利用が進むと思われるが、既に実績

を上げているのが、本章でヒアリングを行った IBM の Watson Health である。医療・ヘ

Page 135: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 128 -

ルスケア分野で蓄積された膨大な量の患者データや学術文献などは、既に人間の解析能力

を超えた量となっている。これを人工知能によって解析すれば、新たな知見などが得られ

るだろう。患者に対しては、より適切な治療法などを提示し、医療の質向上や医療費の削

減などに繋がることが期待されている。

Watson においては、現時点では診断そのものは行わず、医師の診断をサポートする立

場と考えており、今回のヒアリングにおいてもその点が強調されていた。しかし、人工知

能の進歩は著しく、将来的に(少なくとも能力の低い)医師より高度の能力を備えるよう

になった際には、現在の法制度を変える必要が生じるかもしれない。人工知能の利用とし

ては自動車の自動運転が実用化に向けて進んでいるが、自動車は人間が運転するから事故

が生じるのであり、人工知能の性能が十分に高ければ安全であるという考え方がある。医

療においても、近い将来に人工知能自らが診断を下すような時代が来るかもしれない。

【参考文献】

1) IBM Watson for Oncology ホームページ:

http://www.ibm.com/smarterplanet/jp/ja/ibmwatson/watson-oncology.html

2) 朝日新聞デジタル 2016 年 9 月 18 日:

http://www.asahi.com/articles/ASJ8V5F5GJ8VULBJ00J.html

3) IBM Watson ホームページ:http://www.ibm.com/smarterplanet/jp/ja/ibmwatson/

4) 溝上 敏文、「コグニティブ・コンピューティングと医療の世界 -IBM ワトソンを支

える機械学習と自然言語処理」実験医学、Vol.34、105-110 (2016)

5) 小山 尚彦、他、「ワトソンによるがんゲノム解析」、第 39 回日本分子生物学会年会発

表要旨 (2016)

6) IBM Watson Discovery Advisor ホームページ:

http://www.ibm.com/smarterplanet/jp/ja/ibmwatson/discovery-advisor.html

7) Spangler, S., et al., “Automated hypothesis generation based on mining scientific

literature”, http://dx.doi.org/10.1145/2623330.2623667 (2014)

8) Apple ResearchKit ホームページ:http://www.apple.com/jp/researchkit/

9) IBM Explorys ホームページ:https://www.ibm.com/watson/health/explorys/

10) Merge Healthcare ホームページ:http://www.merge.com/

11) Unified Medical Language System ホームページ:

https://www.nlm.nih.gov/research/umls/

12) 特定非営利活動法人 医学中央雑誌刊行会ホームページ:http://www.jamas.or.jp/

13) 東京大学大学院医学系研究科 社会医学専攻 医療情報学分野・公共健康医学専攻ホー

ムページ:http://www.m.u-tokyo.ac.jp/medinfo/

14) 臨床医学連結知識データベース LiLak ホームページ:

http://www.str-v.com/ontology.html

15) 大塚デジタルヘルス株式会社ホームページ:https://www.mentat.jp/jp/

16) Illumina TruSight Tumor 170 ホームページ:

https://www.illumina.com/products/by-type/clinical-research-products/trusight-tu

mor-170.html

Page 136: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 129 -

〔2〕 創薬への人工知能(AI)の活用: 医薬基盤研での取組み

ヒアリング先:国立研究開発法人医薬基盤・健康・栄養研究所

医薬基盤研究所 創薬デザイン研究センター

インシリコ創薬支援プロジェクト

バイオインフォマティクスプロジェクト

水口 賢司 プロジェクトリーダー

要約

製薬企業や各研究機関などでは、創薬における新薬開発の莫大な開発費用の削減と開発

期間の短縮のため、AI を活用する取組みが始められている。このような環境変化の激しい

中で創薬への AI 活用を想定すると、幾つかの課題を解決していく必要がある。まず一つ

目は、目的を達成するための効率的かつ効果的なコンピュータシステム構築である。二つ

目は、活用する大量に蓄積されてきたビックデータの質の向上である。三つ目は、AI に関

連した技術を受け入れる体制作りである。そして四つ目はビックデータや得られた情報に

対する利用や保有などにおける個人情報保護を含めた法規制の整備である。現在、医療へ

の AI 活用としては、パターン認識技術を利用した CT 画像、X 線画像の分類や、IBM ワ

トソンの自然言語処理技術と機械学習技術を利用した臨床データ、データベース情報、あ

るいは論文データなどからの情報収集と情報認知、及びデータ解析支援などが実際に利用

され始めるとともに、診断支援や治療方法の選択並びに創薬支援への活用へと動きが加速

し始める展開となってきている。今後は AI システムの更なる最適化と進化を目指した研

究開発並びに、既存のビッグデータのみならずウエアラブルデバイス、ICT、IoT を活用

した良質なラベル付きデータが収集できる環境整備、AI を適切に理解して受け入れること

のできる人的体制、個人情報保護には配慮しながらも情報を容易に活用できる法規制の整

備などが推進されることが期待される。また、AI から得られた情報が個々の患者へフィー

ドバックされ、医療の質の向上が図られるとともに、更にその治療情報が解析方法の改善

や最適化に還元され、次世代の創薬活用に繋がるポジティブサイクルの形成が期待される。

1.はじめに

コンピュータが誕生して 5 年後の 1950 年代から 1960 年代に第一次人工知能(以下 AI)

のブームに始まり、エキスパートシステムや新世代コンピュータ開発機構(Institute for

New Generation Computer Technology ; ICOT) に代表される、1980 年代からの第二次

AI ブームを経て、近年、ビックデータと IoT を背景にデータマイニングやディープラーニ

ングの技術進展と相まって第三次 AI ブームが到来している。

一方、国内の新薬開発は、基礎研究から始まって応用研究、開発研究、申請/審査/薬事

承認の各段階を経て医薬品となるまでに 9-17 年の期間と 1300 億円強(国内 10 社平均)

という莫大な費用を必要とし、成功率は 1/21,677 という低さである(図 1)。

Page 137: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 130 -

図1.医薬品開発の流れと現状

(医薬基盤研究所・水口賢司氏提供資料)

このような状況の中、世界を見渡すと、AI の創薬への活用が進められている。例えば、

米国創薬ベンチャー、Berg Health は、患者と健常者の生体サンプルからのオミックスな

どの膨大なデータを、AI を用いて分析し創薬へ繋げる研究を進め、新規抗がん剤の臨床試

験を行っており、トリプルネガティブ乳がんにおいて腫瘍の縮小が確認できているという。

また、Atomwise は、AI を用いた効率的な化合物スクリーニングにより、エボラ出血熱に

有効な候補薬を迅速発見している。このような事例に加え、海外大手製薬企業による米

IBM Watson の活用など、日本より一歩先んじて AI を用いた創薬で医薬品開発の効率化

を図っている。日本では、武田薬品工業、第一三共、アステラス製薬などの製薬企業が漸

く米 IBM の Watson を導入し始めるとともに、2016 年末には民間主導で武田薬品工業、

富士フイルムや塩野義製薬などの製薬関連企業と富士通や NEC などの IT(情報技術)企

業を含めた約 50社連合と理化学研究所や京都大学とが連携協力して独自の創薬用 AI 開発

と、AI を活用した創薬のプロジェクトを開始することが報道された。一方、公的な動きと

しては文部科学省、経済産業省、総務省、厚生労働省などで AI の産業への活用を前提と

した取り組みが始まっており、特に厚生労働省では、AI を活用した創薬ターゲットの発

見・同定に繋げることを狙って関連予算を 2017 年度予算案に計上している。これを受け

て、国立研究開発法人の医薬基盤・健康・栄養研究所において、創薬への AI 活用を来年

度に開始する計画であると聞き、これを担当される水口プロジェクトリーダーにお話しを

伺うこととした。

2.国立研究開発法人の医薬基盤・健康・栄養研究所での AI創薬への取り組みと課題

国立研究開発法人 医薬基盤・健康・栄養研究所(以下、NIBIOHN)は、①医薬品の基

礎的技術研究、②難病・疾患資源の研究、③創薬支援スクリーニング、④医薬品等の研究

開発振興等に取り組み、民間企業、大学などにおける新たな医薬品・医療機器の開発を目

指した研究開発を支援している1)。この創薬支援の一環として、NIBIOHN の事業として

AI を用いた創薬に取り組もうと、厚生労働省を通して 2017 年度予算案に関連予算を計上

している。NIBIOHN では、創薬への取り組みとして、今までにバイオインフォマティク

Page 138: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 131 -

ス及び計算生物学分野の最新の技術を活用し、創薬支援を目的とした各種疾患関連実験デ

ータの解析と新規解析方法の開発に関する研究を行なっており、遺伝子やタンパク質の働

きをシステムとして理解することに基づく、新たな創薬の展開を図っている。

特に以下の 2 点を機軸に創薬支援事業を行っている。

I. 有効性、安全性の両面に寄与する方法論開発

遺伝子・タンパク質・化合物関連統合データベースシステムの開発

ネットワークレベルでの創薬標的関連因子の絞り込み手法の開発

安全性評価のためのバイオマーカー探索・データベース開発

タンパク質の構造、機能、相互作用予測法の開発

II. 個々のシステムへの活用

感染症、がん、ワクチン開発、神経疾患、慢性炎症性疾患、膜タンパク質関連な

どの実験データの解析と仮説提唱による実験研究の主導

医薬品開発が困難な理由として、一番目に「応用研究の難しさ」、二番目に「創薬ターゲ

ットの枯渇」があげられる。アカデミアの研究成果に基づき、基礎研究から探索研究、最

適化研究、非臨床試験、臨床研究・治験の一連の各研究開発ステージをクリアすることは

非常に難しく、先に示したように最終候補の化合物が治験まで進む確率は極めて低い。加

えて、医薬品としての性質に適うレベルまで治験薬の品質を高めることは応用研究にとっ

てまさに「死の谷」である。一方、創薬ターゲットに関しても、そもそも医薬品開発で容

易なターゲットは既に研究され尽くしているため、新たに標的とする生体内の分子を既存

の方法で新規に発見することは非常に難しく、限界を向かえている現実がある。また、臨

床試験開始後の新薬候補の開発中止については、初期段階での創薬標的の選定の基準とそ

の評価方法の適切さが確立できていないことが一つの要因になっていると推察される(図

2)。

図2.創薬における課題

(NIBIOHN・水口賢司氏提供資料)

今後、これらを踏まえて新しい概念での創薬ターゲット探索を思考していく必要があり、

Page 139: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 132 -

AI の創薬活用は、ベースとなる計算生物学的手法が標的分子周辺のパスウェイのバイオロ

ジーについての理解を深めることに役立ち、創薬研究のより早期のステップで適切な標的

分子を発見、評価することに貢献できる新しい手法になる可能性が示唆されている。さら

に、そのような生物学的理解は、分子メカニズムに基づく新たな創薬戦略の策定にも繋が

ると考えられる。

NIBIOHN ではこれらを踏まえ、AI 創薬活用のターゲットとしてまずは「創薬ターゲッ

トの枯渇」の解決への活用を選定し、新規手法による創薬ターゲット探索を狙って取組み

を開始する予定である。以下に創薬における課題の解決策として NIBIOHN が既に取り組

んでいる「応用研究の難しさ」の克服と、これからの AI 活用を考えている「創薬ターゲ

ットの枯渇」の解決について紹介する。

3.NIBIOHN での課題解決への取り組み1: 応用研究の難しさの克服

NIBIOHN では、既に応用研究の難しさの克服という課題に対して、毒性・体内動態予

測システムの開発とインシリコスクリーニング点に焦点を当てて、コンピュータシステム

構築による取組みで課題解決を狙っている。この取り組みは「創薬支援インフォマティク

スシステム構築」という AMED の委託事業の枠組みで進められており、体内動態、心毒

性、及び肝毒性の 3 つの領域において基礎的な情報を集積して統合したデータベースを作

成整備し、それに基づいた多面的なモデル、予測システムを作成している。

このプロジェクトは幾つかの研究機関の連携による共同研究体制で推進されており、体

内動態に関してはNIBIOHNの水口プロジェクトリーダーが機械学習とシミュレーション

を用いた代謝酵素に対する安定性や中枢移行性、血中薬物動態などの予測システム構築を、

心毒性に関しては理化学研究所制御分子設計研究チームの本間チームリーダーが機械学習

とシミュレーションを用いた方法により心毒性の原因タンパク質への作用予測システム開

発を、また肝毒性については NIBIOHN トキシコゲノミクス・インフォマティクスプロジ

ェクトの山田プロジェクトリーダーが iPS 細胞由来幹細胞などのバイオマーカーを用いた

肝毒性予測システムの開発に取り組んでいる(図 3)。

製薬企業のデータを取り込むことでより高度なコンピュータシステムを開発するため、

具体的なコンソーシアムという形はとっていないものの、企業 10 社程度の参画による勉

強会という形で先ずは体内動態での取り組みを昨年秋より開始している。

Page 140: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 133 -

図3.創薬支援インフォマティクスシステム構築

(NIBIOHN・水口賢司氏提供資料)

4. NIBIOHN での課題解決への取り組み 2: 創薬ターゲットの枯渇の解決

NIBIOHN では、創薬ターゲットの枯渇という問題に対して疾患関連情報の蓄積という

施策で課題解決を図ろうと計画している。具体的にはビッグデータを整理して統合し、そ

こからオミックスなどの分子レベルの情報を収集し、遺伝子やタンパク質などの機能や相

互作用といった情報と、実際のヒト個体の臨床情報とを結びつけることによって、どの分

子が実際に疾患に関わっているのかどうかや、どのタンパク質を制御すれば疾患の治療に

繋がるのかといった判断をなるべく研究開発の早い段階で行えるようなシステムの構築を

目指している。また、実際の臨床情報に関しては、様々な医療機関と連携して情報を収集

し、コンピュータで解析可能な情報に整備していくことを想定している(図 4)。

図4.創薬における課題解決 創薬ターゲットの枯渇~疾患関連情報の蓄積

(NIBIOHN・水口賢司氏提供資料)

Page 141: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 134 -

一方、関連する分子レベルの情報については、NIBIOHN の中でのこれまでのオミック

ス解析の成果などを使用するとともに、新規実験データの蓄積及び文献情報を学習させ、

新規分子ネットワーク情報と疾患情報との関連性を見つけていく予定である。そして最終

的には構築するシステムを利用して、例えば遺伝子あるいはタンパク質がどの疾患に関わ

っているというような新規の仮説を立てられるようにし、実験的に検証することを可能に

することを考えている。具体的な疾患として何を選択するかなどは未定であるが、現時点

では下図のような枠組みで AI 基盤を構築し、アプローチしようとしている(図 5)。併せ

て、臨床データをどう入手し統合するのか、またオミックスデータとどう関係付けていく

のかという点についても検討中である。

図5.創薬における課題解決 創薬ターゲットの枯渇~AI によるビッグデータ利用

(NIBIOHN・水口賢司氏提供資料)

臨床データの入手、活用など革新的な創薬の実現へ向けた取り組みとして、NIBIOHN

では国立がんセンターとの包括的な連携の元に進めていくことを発表しており(2017 年 1

月 13 日)、両者が保有している試料、情報の共有から人材交流により、創薬へ向けた研究

成果の最大化へ向けた取り組みを進める。このような他の国立機関との包括協定締結は、

NIBIOHN にとって初めての試みである。

5. AI創薬おけるインプット情報に関する課題

AI の創薬活用において、ビックデータという情報の利用は不可欠である。この不可欠な

情報利用において、情報の質の向上と必要な情報量の確保という二つの課題がある。

まず、各種データベースや文献情報、数値化されたオミックスデータなどは、比較的情

報の質が揃っているため、AI への導入が容易であるが、実際の臨床情報は記載されている

情報の言語や疾患の表記方法、あるいは保険申請上の表記と実疾患表記との乖離、さらに

は、ガイドラインなどの変更による疾患名や疾患ステージの変更など、機械学習させるに

は情報としての質が十分でない。今後、情報の整理とその情報の変換作業を行って機械学

Page 142: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 135 -

習が可能な質の情報にする必要がある。例えば東京大学の大江教授が進めている事業の成

果が利用できるように連携するとか、実際コホート研究にかかわっている AI 関連企業と

も連携し、キュレーション可能な自然言語処理支援ができる仕組みを作っていく必要があ

ると考えている。

また、必要な情報量の確保に関しては、ビックデータという莫大な情報源はあるものの、

情報の質の問題も含め、創薬を志向した際に未だ揃っていない領域のデータもあれば、欠

損しているデータもある。NIBIOHN では、例えば難病のレジストリ、データベースを作

成する事業を進めており、メタゲノム解析の結果を利用した腸内細菌のデータベース化な

ど、目的や必要に応じた独自のスモールデータからの充実化も図っている。しかしながら、

欠損のないきれいな情報の量が少ないのは現実であり、公的データのオープン化と併せて、

今後公的に保有している医療情報や製薬企業の医薬品申請情報、あるいは各企業が独自に

保有している医薬品開発時の膨大な整理されたデータを統合した日本独自のネットワーク

型人工知能インフラの構築及びその活用の実現化が必要と考えている。

6. 執筆担当者所感

今回、日本での創薬への AI 活用について NIBIOHN でヒアリング行った他、関連調査

を進めたが、世界の進展状況と比較するとやっと始まったばかりの感があり、AI 活用以前

の基礎データの収集やコンピュータシステムの構築あるいは最適化の模索を進めている、

基盤構築の初期フェーズであると目に映った。

現時点で世界に目を向けると、日本発のシステムではなく、米国発の IBM の Watson

などが世界の製薬企業で優先的に利用されてきているコンピュータシステムであるのが現

実で、インターフェイスの充実化と相まって、日本企業でも創薬活用の選択肢の一つとし

て利用され始めている。一方、日本では、最近の報道にもあるように、武田薬品や NEC

など 50 社の協働による民間を中心とした AI 創薬への取り組みが始まるとともに、国家プ

ロジェクトとして総務省、経済産業省、文部科学省の 3 省連携による取り組みが始まって

おり、理化学研究所、産業技術研究所などの研究機関を中心に官民連携や各種医療機関と

連携して創薬を含む医療全般への AI 活用が進んでいる。しかし、実際には縦割り行政の

障壁などが影響し、医療領域に対しては、必ずしも AI の創薬活用への予算配分が十分で

あるとは言えない。今後、実質的な省庁連携を進めて頂き、無駄のない予算活用と効率的

な研究開発を推進し、創薬活用への展開の強化を推進して頂きたい。

また、日本発の AI 創薬システムとして世界をリードするためには、日本が得意とする

コンピュータシステムの構築だけでは足りず、使えるビックデータ及び連携可能なスモー

ルデータの質と量の整備を進めていく必要がある。医療情報、特に電子カルテなどの普及

推進と併せ、臨床情報の言語も含めた記載表記の共通化を法制化するとともに、保険申請

情報との齟齬を解消できる記録方法及び方式を定めていく必要があると考える。

さらに、今後はクラウド利用などネットワーク連携のデータベースへ移行していくこと

は、利便性も含め時代の流れであることから、強固なセキュリティでデータが管理される

必要がある。しかしながら、利用に当たっては、法的整備も含めて目的に応じたデータ利

用が可能な環境を整備する必要があると考える。

最後になるが、一番重要なことは、AI を活用できる人材を育成することが急務であると

Page 143: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 136 -

考える。AI の構築にあたっては、いろいろな関連する分野の専門家により開発が行われて

いる。AI は万能ではなく、得意とすることと不得意なこともあれば、人間に追いついてい

ない能力もある。それがゆえに、AI を如何に創薬へ効率的に活用できるかはその AI を使

用する人材に委ねられる。バイオインフォマティクス技術者認定の様に、ある一定レベル

以上の AI 技術者を養成していく必要があると考える。

今後、官民に関わらず、AI を適切に理解し、それを活用できる体制を整え、現実的な活

用範囲を見極めて AI の創薬活用を推進することで、創薬の効率化を図るとともに医療の

質の向上にも役立て、医療費の抑制と医療全般の進展並びに医療を受ける方々の健康に貢

献することを期待している。

参考資料

1) 医薬基盤・健康・栄養研究所ホームページ:

http://www.nibiohn.go.jp/introduction/objective.html

Page 144: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 137 -

〔3〕 ゲノム解析の今後の鍵となる基盤技術である人工知能について

人工知能の現状並びに将来への課題

ヒアリング先:

東京大学医科学研究所ヒトゲノム解析センター

宮野 悟 センター長・教授

要約

がんの診断は遺伝子を網羅的に解析し、がんの変異に適した治療薬を選択する時代に入

りつつある。次世代シークエンス技術(Next-Generation Sequencing、NGS)などによ

って得られるデータは膨大であり、効率的にかつ速やかに解析して治療方針を決定するた

めの全く新しい情報処理技術を必要としている。東京大学医科学研究所(以下、医科研)

ヒトゲノム解析センターの宮野センター長らは IBM の人工知能“Watson for Genomics”

を用いて、ゲノムデータからがん遺伝子を特定し、膨大な文献情報から治療方針の選択を

行う研究を展開している。この研究は、回復の見通しがつかない白血病患者の命を救うと

いう結果を出し、反響を呼んだ。まだ解決すべき課題は多いが、新しい医療技術として今

後の研究成果が期待される。宮野センター長らの技術はがんに限らず多くの疾患への応用

が期待され、参加型医療体制構築へ向けての提案を発信している。

1.はじめに

現在、日本人の死因のトップはがんであり、3 人に 1 人ががんにより死亡している。が

んはゲノムに変異が起こり、正常な細胞の活動がシステム異常を起こしている状態といえ

る。最近のがん治療では、患者のゲノムをシークエンス解析し、がん変異遺伝子を特定し、

医学論文などの臨床情報と合わせることで、治療戦略を決定する方向に変化しつつある。

ゲノム解析のデータは膨大で、これらの情報をいかに効率的にかつ速やかに解析し、臨床

情報と照らし合わせて医療情報(臨床シークエンス)として提供できるかが課題となって

いる。

医科研では、患者の全ゲノムを解析し、臨床現場の医師と議論して治療方針を決めてい

くための鍵となる基盤技術として、人工知能を用いた解析を行い、複数の実績を挙げてい

る。人工知能を用いた解析例、及び今後に向けた課題について、医科研ヒトゲノム解析セ

ンター、宮野センター長に伺った。

2.人工知能(AI)の医療への必要性

機械学習は医学も含めて多くの科学において複雑な問題を解決するのにありふれた、か

つ不可欠なものとなりつつある1)。適切な医療を提供する上で、機械学習つまり AI を上

手に使うことが求められている。日本医師会も「AI と医療」という委員会を作って調査を

進めている2)。AI がなぜ医療に必要かを理解するには、以下に紹介する事例を通して得た

知見を知る必要がある。

(1) AI を用いた医療の事例

全ゲノム解析を行うことでがん治療に成功した最初の例を紹介する。Washington

University の Dr. Lukas Wartman は血液がんを専門とする研究者であるが、2003 年に急

Page 145: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 138 -

性リンパ芽球性白血病(ALL)であると診断され、2 回の化学療法を受け寛解していた。し

かし、成人の ALL 完全治癒率は低く、2011 年に 3 度目の発症をした時には標準治療に耐

えることができなくなっていた。NGS で解析することを了承し、結果をスーパーコンピュ

ータで解析してVEGF受容体キナーゼファミリーの 1つである FLT3遺伝子の発現が亢進

していることを明らかにした。FLT3 阻害剤が自身のがんに有効である確証はなかったが、

FLT3 阻害剤として知られる分子標的薬スーテント®(SUTENT®、sunitinib、Pfizer 社)

による治療を試みたところ、改善が認められた。結果として Dr. Wartman は寛解し、現

在も研究者として活動をしている3)。

本事例では、スーテント®服用後、骨髄移植手術をしており、寛解がスーテント®だけの

効果によるものかはわからないが、全ゲノムを NGS で解析し、スーパーコンピュータで

がん遺伝子を探索し、適切な治療薬を見つけた意義は大きく、我々がどこへ向かって進む

べきかを示唆している。すなわち、全ゲノムを NGS で解析し、スーパーコンピュータで

疾患遺伝子を探索して、医学知識を応用して適切な治療方法を決定することの実現が目標

となる。

(2) AI を用いた医療の課題

AI を用いた医療の実現に向けては、以下に示すように課題も多い。

第一の課題は、NGS などの技術革新に伴い膨大なゲノム情報などが蓄積されつつあるこ

とである。米国 Seven Bridges Genomics の報告によれば、NGS によるシークエンス情報

は、2018 年には 2 エクサバイトを超えると予想されている。

第二の課題は、医学知識も膨大な量になりつつあることである。PubMed には既に 2,600

万件の論文が登録されており、そのうち、がん関連で 2015 年に報告されたものだけでも、

20 万件を超え、2050 年にはプリントして積み上げれば、高さ 100 km を超え成層圏に達

する量と予想されている。とても人間が読める量ではなくなっている。

第三の課題は、疾患の複雑さである。大腸がん患者の腫瘍部を約 10cm 摘出し、その 20

数箇所を区別してサンプリングし、エクソーム、メチローム、トランスクリプトーム、RNA

発現などを解析すると、非常に多様性のあることが分かり、僅か 5 mm 違った箇所のゲノ

ム配列でさえも違っている。あるいは、腸の内側か外側かというだけでプロファイルが異

なっていることも明らかとなってきた4)。

第四の課題は、2、3 個の遺伝子を解析するだけでは、正しいがん治療戦略が得られない

という認識が広まっていることである。2015年に約2万人のBRCA1遺伝子(breast cancer

susceptibility gene I)に変異を有する女性の解析結果が報告されている。そこでは、46%

の女性は乳がん発症、12%が卵巣がん、5%が両方、しかし、37%は 70 歳まで何も発症し

なかったことが報告されている。BRCA1 遺伝子には 365 個の体細胞変異が報告され、し

かも、それらの多くがタンパク質のコーディングリージョンで変異が起きている5)。体細

胞変異に関しては、英国サンガー研究所(Sanger Institute)のデータベースである

COSMIC(Catalogue Of Somatic Mutations In Cancer)に登録されているが、2016 年

11 月の時点で約 410 万以上の体細胞突然変異が報告され、2 万4千ほどの文献との紐づけ

が行われいる。

これらの膨大な情報を処理するためには、AI の利用が有効ではないかと医科研ヒトゲノ

Page 146: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 139 -

ム解析センター、宮野センター長らは研究を展開している。

3. ビッグデータ解析プラットフォーム Genomon について

医科研で行われている NGS によるがんゲノム解析においては、正常部のゲノム配列を

決めるときは 30 コピー、病巣部においては 40 コピー以上して配列を解析している。例え

ば 1 人の患者につき、塩基数が 30 億文字×(正常 30 コピー+病巣 40 コピー)として、

2,100 億文字のシークエンスを行う。NGS から得られる 1 リードあたりの塩基配列数が

100 塩基として単純に割ると、約 21 億個の断片が得られる。医科研ではこの膨大な量の

シークエンスデータ解析のため、Genomon というデータ解析プラットフォーム(ソフト)

を開発した6)(図1)。得られた配列情報から SHIROKANE シリーズと命名されたスーパ

ーコンピュータを用いて、ジグソーパズルを解くように、germline 上の配列との比較、そ

して変異コール、構造異常、RNA シークエンス情報がある場合は融合遺伝子の探索も行う。

図 1. Genomon システムの概要

(東京大学医科学研究所・宮野悟氏提供資料)

Genomon が初めて貢献した解析例として、骨髄異形成症候群(Myelodysplastic

Syndrome、MDS)患者の事例が 2011 年に報告されている。MDS 患者の 29 サンプルを、

Page 147: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 140 -

当時東京大学医学部附属病院(現京都大学腫瘍生物学)の小川誠司教授がシークエンス解

析する一方で、数理的手法により高精度に変異を同定する方法を開発した。29 サンプルか

ら 268 の変異を見つけ、既知のがん関連遺伝子変異以外に新たに 4 つの遺伝子を同定し、

それらが RNA スプライシングパスウェイに関する遺伝子の変異であることを明らかにし

た。これは、RNA スプライシング変異ががんの原因遺伝子であることを発見した初めての

報告になった7)(図 2)。

図2. 骨髄形成症候群(MDS)での Genomon による解析の事例

(東京大学医科学研究所・宮野悟氏提供資料)

現在医科研に設置されている SHIROKANE3 の性能は、 414 テラ FLOPS

(Floating-point Operations Per Second、処理速度の性能指標。理化学研究所計算科学研

究機構の「京」は 10 ペタ FLOPS)、ストレージは Lustre ファイル(分散ファイルシステ

ム、Linux + Clusters から取った造語)、ニアライン(オンラインストレージとオフライ

ンストレージの中間)などを入れて、約 12 ペタバイトのストレージを有している(図 3)。

2017 年 4 月には SHIROKANE4 が追加導入され、SHIROKANE3 と合わせて計算性能は

約 550 テラ FLOPS、Lustre ファイルは 30PB になる。

Page 148: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 141 -

図3. 医科研スパコン SHIROKANE シリーズ構成

(東京大学医科学研究所・宮野悟氏提供資料)

Genomon は、スーパーコンピュータ「京」にも一部実装しており、成人 T 細胞白血病

(ATL)の全ゲノム解析を行い、新たに、ATL のパスウェイ異常の全貌を明らかにした8)。

さらに、その中で免疫チェックポイント遺伝子の構造異常を突き止めた。具体的には

PD-L1 のタンパクコード領域ではない、3’-UTR 部分の構造異常であった。この構造異常

が転写されたメッセンジャーRNA の分解が阻害されていることが分かり、結果として

PD-L1 タンパク質が蓄積されることを見出した。さらに、33 種のがんについて、1 万以上

のデータを解析したところ、ATL だけでなく複数のがん種においてもこの構造異常が見つ

かった。このような構造異常のある患者には免疫チェックポイント阻害剤投与により

PD-L1 遺伝子の発現が亢進するため著効することが予想される9)。

4.Watson を用いた臨床シークエンスの事例

今後はノンコーディング RNA の構造異常、疾患への影響なども解析し、治療戦略を立て

る必要性がある。しかし、そのためには、更に膨大な情報処理が必要となり、人の能力で

すべてを把握することは不可能であるため、AI というアプローチを取り入れることにした

(図4)。

Page 149: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 142 -

図4. Genomon と AI(IBM Watson)を合わせたシステム

(東京大学医科学研究所・宮野悟氏提供資料)

AI としては IBM の Watson を採用しているが、IBM は AI について、「Artificial

Intelligence」ではなく、「Augmented Intelligence」、即ち「人知の増強」という概念を

推奨している。

IBM は社の創始者に倣って命名された Watson の開発に 40 億 US ドルを投資している

という。Watson には 2,000 万件の PubMed の Abstract、1,500 万件の医薬品特許情報、

変異情報データベース COSMIC、米国 National Institutes of Health(NIH)の健康・疾

病データベースである ClinVar、米国 National Cancer Institute(NCI)のパスウェイデ

ータベースなどを学習させている。また、学術雑誌出版大手の Elsevier と提携しているこ

とも強みである。Watsonは2015年7月に、北米以外では初めて医科研に「Watson Genomic

Analytics」として導入された。医科研導入時には、血液がん関連の情報が Watson に不足

していたため、IBM の協力の下、関連情報を学習させた。現在では、Watson for Genomics

に患者の遺伝子解析情報を読み込ませると、学習したデータを参照して 10 分から 30 分で

回答をアウトプットする。得られた回答は、クリニカルカンファレンスにおいて、これま

での報告例や自験例と照会して十分な議論を行い、最終的に医師の判断で患者の治療方法

を選択する。Watson は飽くまでツールであり、人に置き換わる技術ではないが、短時間

で有益な情報を提供し医療の質を高めることが期待される。

一方、このような臨床シークエンス情報は、患者の究極の個人情報であり、厳重なセキ

ュリティシステムが必須である。医科研内のラボでは、入室の際の生体認証システムを導

入し、端末にはデータが保存できない Thin Client PC を導入し、さらにシークエンス解析

からデータ解析に至るまで、一貫してデータのトレーサビリティを担保する Clarity LIMS

という情報マネージメントシステムを導入して運用している。システムの維持費用が必要

になるが、サンプル取違えのリスク回避や、何よりも患者さんに安心して研究に参加して

もらえる環境作りのためには必要な投資であると考えている。

Page 150: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 143 -

急性骨髄性白血病と診断され、Watson による解析を参考にして治療方針を切り替えた

結果回復した日本人女性の事例が 2016 年 8 月 4 日の NHK ニュースで紹介され大きな反

響を呼んだ10)。本事例では、当初、診断に沿って標準治療に基づいた治療が行われたが、

回復の兆しが見られず、副作用も見られた。そこで、患者のゲノム情報を Watson for

Genomics を使って解析したところ、僅か 10 分で回答が得られ、STAG2(stromal antigen

2)遺伝子という、二次性白血病に関与する遺伝子の異常の可能性を指摘した。これを受

けて治療方針を変更したところ、患者は回復し、退院にまで至ったという成功例である。

本事例は臨床研究での範囲であるが、今後実臨床の中で Watson のような AI がどのよ

うな位置付けで使われるのか不明である。既存のサポートシステムやソフトウェアと同様

に医療機器とするか、別な取扱いがあるのか、AI の広げ方を考えなくてはならない。米国

では、「The 21st Century Cures Act」11)という法案が 2016 年 12 月に上院を通過し、オ

バマ大統領の署名を経て動き出した。その 3060 条で、医療機関の経営支援用ソフトや電

子カルテなどのこれまでも非医療機器とされていたものに加え、以下のものは医療機器で

はないことを明確化している。

①患者個人の医療情報やその他の医療情報(論文など)を表示・分析し、

②医療関係者に診断、治療などの支援又は、推奨(recommendation)の提示を行い、

③かつ、医療上の判断を下す際に、当該推奨を最初から当てにすることのないように、

医療関係者がそれらの推奨の根拠を独自にレビューすることができるようにしている

もの

④ただし、画像診断情報や診断機器から信号の分析をするものを除く。

これから判断すると Watson for Genomics はこの医療機器には該当しないと考えられる。一

方、がんの画像診断などは医療機器にはいるものと推察される。

5.参加型医療体制構築に向けて

Watson をはじめ AI には臨床研究の発展・医療の高質化の観点から多くの可能性がある

が、AI を活用した医療の実現には、適切なビッグデータの蓄積・整備が必要であると考え、

米国の Precision Medicine Initiative を参考にして、同様のシステムを日本において構築

すべく「参加型健康医療エコシステム」が提案されている(図 5)。公的データベースが永

続的にデータを集積し、利用者が無料でアクセスできるというシステムではなく、参加者

に何らかのメリット(リウォード)がある仕組みが作れないかと考えられている。参加者

から得られる様々なデータは個人の所有財産であるという考え方を基本にして、遺伝子発

現などから得られる貴重な情報を活用する参加型健康医療システムを通して、自発的ビッ

グデータ集積・シェアリングエコシステムの推進を図っている。

Page 151: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 144 -

図5. 参加型健康医療エコシステム

(東京大学医科学研究所・宮野悟氏提供資料)

6. 執筆担当者所感

今回、Watson の活用例として、主に血液がんを対象とした解析例をいくつか紹介して

いただいた。人工知能の歴史や Watson の開発については、別項で報告されている田中 博

名誉教授(東京医科歯科大/東北メディカル・メガバンク機構)や、日本アイ・ビー・エ

ムのヒアリング報告を参照していただきたい。

紹介された事例の多くは血液がんであったが、宮野センター長によれば、血液がんは急

性増悪するケースが多く、緊急措置的に臨床シークエンスを実践することが多いためであ

り、固形がんあるいはその他の疾患においても Watson は十分に応用可能であるというこ

とであった。

しかしながら、腫瘍組織の局所ごとの遺伝子発現プロファイルが、ミリ単位で多様性を

持つこと、あるいはがん発症・進行における、時系列的な変遷が見られるため、血液がん

では比較的簡便に行えるサンプリング(生検)が固形がんでは実施しにくいこと、さらに、

ノンコーディング領域の構造変化情報など、現在の Watson には学習させていない情報を、

いかに取り込んで判定に活かしていくかという課題は残っている。

また、創薬への応用という観点においては、パスウェイ解析による既存薬の適応拡大の

可能性も考えられるとのことであった。

さらに、現在計画中である参加型医療システム構築における、ビッグデータの蓄積と AI

などの基盤技術の応用については、がんに限らず、高血圧や脂質異常症、あるいは糖尿病

といった Common Diseases への応用も十分期待される。そのためにも、国民が産学官と

一体となった公正で柔軟な取り組みが必要である。また、情報提供者である参加者にメリ

ットがあるシステムが必要であると強調されていたのが印象的であった。

Page 152: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第二章 ビッグデータ、人工知能、マイクロバイオーム等の

創薬ならびに予防・先制医療への活用

- 145 -

【参考文献】

1) Obermeyer Z et al., Predicting the Future ‐ Big Data, Machine Learning, and

Clinical Medicine. N Engl J Med., 375(13): 1216-9, 2016.

2) 日本医師会プレスリリース.医療分野の IT 化の新たな指針「日医 IT 化宣言 2016」

を公表.

https://www.med.or.jp/nichiionline/article/004485.html

3) Kolata G, In Treatment for Leukemia, Glimpses of the Future. The New York

Times, Jul 7 2012.

http://www.nytimes.com/2012/07/08/health/in-gene-sequencing-treatment-for-leuke

mia-glimpses-of-the-future.html

4) Uchi R et al., Integrated Multiregional Analysis Proposing a New Model of

Colorectal Cancer Evolution. PLoS Genet., 12(2): e1005778, 2016.

5) Rebbeck TR et al., Association of type and location of BRCA1 and BRCA2

mutations with risk of breast and ovarian cancer. JAMA, 313(13): 1347-61, 2015.

6) Genomon ホームページ: http://genomon.hgc.jp/exome_original/index.html

7) Yoshida K et al., Frequent pathway mutations of splicing machinery in

myelodysplasia. Nature, 478(7367): 64-9, 2011.

8) Kataoka K et al., Integrated molecular analysis of adult T cell leukemia/lymphoma.

Nat Genet., 47(11): 1304-15, 2015.

9) Kataoka K et al., Aberrant PD-L1 expression through 3'-UTR disruption in

multiple cancers. Nature, 534(7607): 402-6, 2016.

10) 日本放送協会.NHK「かぶん」ブログ.「人工知能 病名突き止め患者の命救う 国内

初か」2016 年 8 月 4 日記事.

http://www9.nhk.or.jp/kabun-blog/200/250456.html

11) The 21st Century Cures Act.

http://docs.house.gov/billsthisweek/20161128/CPRT-114-HPRT-RU00-SAHR34.pdf

Page 153: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第三章 行政ならびに産業・社会動向

- 146 -

第三章 行政ならびに産業・社会動向

はじめに

本章では、医療分野における Information and Communication Technology(ICT)の

活用とゲノム医療推進に向けた行政の取り組みや産業界並びに社会の動きについて、政府

関連機関の発表資料並びに報道機関の記事を元に、情報収集し、取り纏めた。また、ICT

に関連する技術、健康医療サービスなどの産業・社会動向についても報道機関などの記事

を元に、情報収集し、取り纏めた。

〔1〕 ICT を活用した健康・医療推進に向けた行政の取組み

各省庁に関連の委員会、会議、組織等が以下のように立ち上げられている。それぞれの

この1年間の動きについて纏めた。

内閣府・首相官邸: 日本再興戦略、

未来投資会議

健康・医療戦略推進本部

次世代医療 ICT 基盤協議会

厚生労働省: データヘルス改革推進本部

保健医療分野における ICT 活用推進懇談会

保健医療分野における AI 活用推進懇談会

1. 日本再興戦略 改訂 2016

2016 年 6 月 2 日、持続的な成長路線に結びつけ、「戦後最大の名目 GDP600 兆円」の実

現を目指す、「日本再興戦略 2016」が閣議決定された。その中で、第 4 次産業革命を目指

し、新たな有望市場の創出に向けた課題・目標が掲げられた1)。以下、関連事項のみ抜粋

した。

1)第 4 次産業革命(IoT・ビッグデータ・知能)、

・人工知能(AI)に関するグローバル研究拠点の整備

(人工知能とものづくり技術の融合に向けた国際的な産学連携)

・最先端 AI データの生成・利活用促進による技術開発・社会実装

・データ利活用⽤のための環境整備の促進

2)世界最先端の健康立国へ

・医療のデジタル革命の実現(人工知能を利用した診療支援の開発等)

・医療・健康データの利活用を通じた産業の活性化

(クラウド型医療ネットワークの高度化等)

・産学官共同での医薬品・医療機器の研究開発の促進等

Page 154: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第三章 行政ならびに産業・社会動向

- 147 -

前者の「第 4 次産業革命」の AI の基盤整備については、医療に関する記述はないもの

の、後者の「世界最先端の健康立国へ」のところにおいて、IoT の利活用について言及さ

れていることから、AI の基盤整備とデータの利活用について、医療への応用も含まれるも

のと読み取れる。

後者の「世界最先端の健康立国へ」の中で、「レセプトや健康診断のデータに加えて、ウ

ェアラブル端末等の IoT によるデータ収集を活用した健康・医療サービスの実現やビッグ

データと人工知能、ロボット等の新技術の活用へと第4次産業革命への対応を加速化なら

びに膨大な臨床データと個々の患者の状態を踏まえた創薬、医療機器開発、個別化サービ

ス等が実現していく」と述べられている。鍵となる施策についても、第一に、ビッグデー

タ等の活用による診療支援・革新的創薬医機器開発(治療や検査のデータを広く収集し安

全に管理・匿名化する新たな基盤を実現)、第二に、IoT 等の活用による個別化健康サー

ビス(レセプト・診デ等の活用による個別化健康サービス(レセプト・診デ等の活用)、健

康・予防に向けた保険外サービス促進、などが挙げられている。

2. 健康・医療戦略推進本部: 医療分野研究開発推進計画の見直し、ICT利活用促進

2014 年 6 月に閣議決定された健康医療戦略に基づき、健康・医療戦略推進本部が 2014

年 7 月に「医療分野研究開発推進計画」を策定した。一方、ICT などの技術が急激に進歩

し、医療への応用が進む中、新たな保険医療政策が必要となってきた。健康・医療戦略推

進法 (平成二十六年法律第四十八号)では、「健康・医療戦略推進本部は、医療分野の研

究開発を取り巻く状況の変化を勘案し、及び医療分野研究開発等施策の効果に関する評価

を踏まえ、医療分野研究開発推進計画の見直しを行い、必要な変更を加えるものとする。」

となっており、時代に合った医療政策、また次世代に向けた医療政策を実行すべく、2016

年 11月に、その見直し案2)が作成され、政府の健康・医療戦略推進専門委員会でもおお

むね了承されている。現在、健康・医療戦略推進本部で、最終的な作業に入っているもの

と思われる。

公開されている見直し案の中では、ICT の利活用に関して大幅に追記されており、概要

資料の中で、AI 技術の研究開発・実用化については、「革新的な人工知能の基盤技術を構

築し、収集されたビッグデータを基に人工知能技術を活用することで、診療支援や新たな

医薬品・医療技術の創出に資する研究開発を進める。」と記されている。具体的には、本文

中において、“オールジャパンでの医療等データ利活用基盤構築・ICT 利活用推進に関す

る施策”の中に記されており、その一部を以下に抜粋した。

「健康・医療・介護分野においては、これまでデータが分散してつながらない形で ICT の

取組が進められてきた結果、ICT の利活用が一体的に機能せず、現場や産学官の力を引き

出したり、患者や国民がメリットを実感できる形にはなっていないことが課題となってい

る。(・・・中略・・・)具体的には、医療・介護等のデータのネットワーク化や、日常デ

ータ、AI、IoT などの利活用を進め、効果的な健康・予防活動を促進するとともに、全国

各地で個人の症状・体質に応じた迅速・正確な治療を実施するほか、遠隔での診療、患者・

高齢者の見守りを実現し、医療・介護等の資源を効率的に活用して本人の負担や財政負担

を軽減すべきである。加えて、健康・医療・介護等のビッグデータを産学官が活用できる

プラットフォームを整備し、革新的な医薬品・医療機器等の開発を効率的・効果的に進め

Page 155: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第三章 行政ならびに産業・社会動向

- 148 -

るべきである。また、診療・診断の結果に係るデータ(アウトカムデータ)が収集・利活

用できるような環境が整う前であっても、公的医療保険制度の審査支払機関を改革し、診

療報酬請求データ(レセプトデータ)に基づくビッグデータ分析を行うことで実現する健

康づくり(データヘルス)を推進することにより、審査支払機関も保険者もそれぞれが質

の高い医療を実現すべきである。」

このように、本格的に、ICT ならびに AI を活用した医療政策の実現へ向けた基盤整備

が始まろうとしている。

3. 未来投資会議

本会議は、官邸主導にて、日本経済再生本部の下、「未来への投資」の拡大に向けた成長

戦略と構造改革の加速化について審議するため、発足されたものであり、2016 年 9 月 12

日に、第 1 回の会議が開催された。これまでに 5 回(第 5 回 2017 年 2 月 16 日開催)行

われており、特に、保険医療分野については、11 月 10 日に行われた第 2 回の会合で議論

され、その中で、安倍総理は次のように述べている3)。

(発言抜粋)「医療では、データ分析によって個々人の状態に応じた予防や治療が可能にな

ります。ビッグデータや人工知能を最大限活用し、『予防・健康管理』や『遠隔診療』を進

め、質の高い医療を実現していきます。日本の隅々まで質の高い医療サービスが受けられ

る。高齢者が生き生きと暮らせる。社会保障費が減っていく、ということになるわけであ

りまして、これらを一気に実現する医療のパラダイムシフトを起こしていかなければいけ

ません。」

これらの発言は、ビッグデータや人工知能を最大限活用し、予防医療はじめ、新規医薬

品・医療機器の創出から、質の高い医療、保険医療制度も含めた医療のパラダイムシフト

を見据えた政策を実行せよ、とも受け取れるものである。

4. 次世代医療ICT基盤協議会: 臨床情報の利活用に向けて法制化

(1)医療情報取扱制度調整ワーキンググループの活動

閣議決定された日本再興戦略 2016 で、「ビッグデータ等の活用による診療支援・革新的

創薬・医療機器開発(治療や検査のデータを広く収集し安全に管理・匿名化する新たな基

盤を実現)」において、医療等分野の情報を活用した創薬や新規治療法の研究開発の促進に

向けて、治療や検査データを広く収集し、安全に管理・匿名化を行い、利用につなげてい

くための「代理機関(仮称)」制度を検討する」としており、その結果を踏まえて、2016

年度中を目途に所要の法制上の措置を講じることとされた。

次世代医療 ICT 基盤協議会では、有識者を含む医療情報取扱制度調整ワーキンググルー

プ A、B、C、D が設置された。グループ A では、要素整備としてデジタルデータ収集・

交換標準化促進について、グループ B では環境整備として医療情報取扱制度調整ならびに

医療情報匿名加工・提供機関のセキュリティー等について、グループ C では ISO13606 や

SSMIX2 などの大規模な健康医療情報収集利活用事業の推進について、 また特定のニー

ズ・技術的ツールの有効性を念頭においた PHR やコホートデータなどの医療情報等収集

利活用事業ならびに検討会の実施などについて、さらにグループ D では医療への次世代

ICT 導入促進として、医療ビッグデータ解析と人工知能による医療知能情報システム開発

Page 156: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第三章 行政ならびに産業・社会動向

- 149 -

なども調査対象とした。

これらワーキンググループ(WG)のうち、グループ B の医療情報取扱制度調整 WG で

は、医療等情報の利活用を推進するための取り纏め案を 2016 年 12 月に公表し4)、12 月

27 日から翌年 1 月 26 日までパブリックコメントの募集を行った。この報告書では、医療

等情報の利活用の現状と課題等として、利活用の必要性と課題から将来像ならびに個人情

報保護についてまで説明されており、さらに医療等情報の利活用を推進するための新たな

基盤の全体像として、医療情報匿名加工・提供機関(仮称)のあり方など詳細に提案され

ている。

(2)「医療分野の研究開発に資するための匿名加工医療情報に関する法律案」の概要

この提案を基に、健康・医療戦略室で法案の作成が進められ、各医療機関が保有する医

療情報の二次利用の推進を目的とした、「医療分野の研究開発に資するための匿名加工医療

情報に関する法律案」が、2017 年 3 月 10 日に閣議決定され、第 193 回通常国会に提出さ

れた5)。

本法案では、具体的には、個人情報保護法の対象外とした上で、医療機関が安心して医

療情報を提供できるような体制整備を行う、とされている高い情報セキュリティを確保し、

十分な匿名加工技術など一定の基準を満たした機関を「認定匿名加工医療情報作成事業者

(認定事業者)」として国が認定し、この機関は収集した情報を匿名加工し、医療ビッグデ

ータとして製薬会社や研究機関、行政などに提供する。医療機関は、あらかじめ提供者本

人に通知し、本人が提供を拒否しない場合、認定事業者に対し医療情報を提供できる。こ

の法整備によって創薬や治療の研究開発の促進を目指すとしている(図 1)。

図1.「医療分野の研究開発に資するための匿名加工医療情報に関する法律案」の概要

(内閣官房ホームページより5))

Page 157: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第三章 行政ならびに産業・社会動向

- 150 -

5. データヘルス改革推進本部: 健康・医療・介護における ICT インフラ整備

データヘルス改革推進本部では、2017 年 1 月 12 日、初会合が開催された。メンバーは、

厚生労働省の各局長ならびに大臣官房審議官等で構成されており、厚生労働省の部局横断

的に組織されている。主たるタスクは、「世界で初めてとなる、大規模な健康・医療・介護

の分野を有機的に連結した ICT インフラを 2020 年度から本格稼働させるべく、上記の具

体策の検討を加速化する」としており、健康・医療・介護施策のパラダイムシフトを実現

していくための基盤整備を進めるといったものである。改革推進本部の下に、①予防・健

康データ WG、②医療データ WG、③介護データ WG、④ビッグデータ連携・整備 WG を

設置し、本部で作成されたアクションプランに沿ったそれぞれのタスクに向け、作業を進

めるとのことである6)。作業のベースは、後述する保険医療分野における ICT 活用推進懇

談会の報告書なども参考とされている。

6. 保健医療分野における ICT 活用推進懇談会: ICT を活用した次世代保健医療システム

保健医療分野における ICT 活用推進懇談会は、2015 年 11 月 19 日に、意見交換会とし

て発足し、意見交換会等の会合として、これまでに 8 回開催されており、2016 年 10 月に、

提言書が作成された。提言の基本的な考えとして、①保健医療サービスの最大化のために

ICT の技術革新を徹底的に取り入れる、②患者・国民の価値主導を主眼に、ICT の活用が、

患者・国民にとって真に価値のあるものになることが必要である、③患者・国民本位のオ

ープンなインフラを整備し、患者・国民や医療機関等、産官学のデータ利活用を促進する

という 3 つを基本骨子とし、ICT を活用した「次世代型保健医療システム」の実現へ向け

たアクションプランを提示している7)。その中で、「つくる・つなげる・ひらく」の 3 つに

分類し、それぞれのタスクとアクションプランが掲げられている。「つくる」では、基盤技

術開発やステム構築について、次世代ヘルスケアマネージメントシステムとして 2020 年

度から試験的な段階運用を目指し、“つなげる”では、医療 ID や保険のオンライン化につい

て、2018 年度から段階運用を、地域ネットワークの構築、医療事業の共有について、2020

年度から段階運用を目指し、「ひらく」では、医療データなどの公的データベースの整備・

利活用について、2020 年度からデータ利活用プラットフォームの段階運用を目指すとして

いる。

Page 158: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第三章 行政ならびに産業・社会動向

- 151 -

図2. ICT を活用した次世代保健医療システムの全体像

(厚生労働省ホームページより7))

7. 保健医療分野における AI 活用推進懇談会: AI活用領域の特定

前述した保険医療分野における ICT 活用推進懇談会からの提言を踏まえ、今後の AI 活

用を適切に推進するため、保険医療分野における AI 活用推進懇談会が発足され、2017 年

1 月 12 日に第 1 回目の会合が開催された8)。発足趣旨は、医療における AI の活用は必要

であるが、患者に最適な医療や安全な医療を提供するためには、AI を理解し、その活用が

国民にもたらす効果を明らかにし、保健医療等において AI の導入が見込まれる領域を見

据えながら、AI の開発推進ならびにサービス等の質・安全性確保のために必要な対応等を

検討していく、といったようなものである。懇談会の進め方としては、2017 年度春までに、

AI の活用領域の特定、開発基盤等の推進方策、質・安全性確保策について、報告書を纏め、

今後の厚労省ならびに政府の施策に反映させる計画が提示されている。既に、委員である

有識者から、医療分野、特にがん領域における AI がもたらす可能性などが情報提供され

ている。また、AI を専門とする委員からは、AI がもたらす可能性と課題についても情報

提供されている9)。

【参考資料】

1) 首相官邸ホームページ:2016 年 6 月 2 日

「日本再興戦略 2016-第 4 次産業革命に向けて-」が閣議決定されました」

http://www.kantei.go.jp/jp/singi/keizaisaisei/pdf/2016_zentaihombun.pdf

2) 首相官邸ホームページ:2017 年 2 月 26 日 第 17 回健康・医療戦略推進本部会議

資料 1 「健康・医療戦略」一部変更案

http://www.kantei.go.jp/jp/singi/kenkouiryou/suisin/suisin_dai17/gijisidai.html

3) 首相官邸ホームページ:2016 年 11 月 10 日 第 2 回未来投資会議 議事要旨

http://www.kantei.go.jp/jp/singi/keizaisaisei/miraitoshikaigi/dai2/gijiyousi.pdf

4) 首相官邸ホームページ:2016 年 12 月 16 日 第 4 回次世代医療 ICT 基盤協議会

Page 159: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第三章 行政ならびに産業・社会動向

- 152 -

資料 1 医療情報取扱制度調整ワーキンググループとりまとめ

http://search.e-gov.go.jp/servlet/PcmFileDownload?seqNo=0000156044

5) 内閣官房ホームページ:2017 年 3 月 10 日 国会提出法案(第 193 回通常国会)

医療分野の研究開発に資するための匿名加工医療情報に関する法律案

http://www.cas.go.jp/jp/houan/193.html

6) 厚生労働省ホームページ:2017 年 1 月 12 日 第 1 回データヘルス改革推進本部

資料 1 データヘルス改革推進本部について

http://www.mhlw.go.jp/file/05-Shingikai-12601000-Seisakutoukatsukan-Sanjika

nshitsu_Shakaihoshoutantou/0000148418.pdf

7) 厚生労働省ホームページ:2016 年 10 月 19 日

保健医療分野における ICT 活用推進懇談会 提言書

「ICT を活用した「次世代型保健医療システム」の構築に向けて

http://www.mhlw.go.jp/file/05-Shingikai-12601000-Seisakutoukatsukan-Sanjika

nshitsu_Shakaihoshoutantou/0000140306.pdf(同概要)

http://www.mhlw.go.jp/file/05-Shingikai-12601000-Seisakutoukatsukan-Sanjika

nshitsu_Shakaihoshoutantou/0000140305.pdf

8) 厚生労働省ホームページ:2017 年 1 月 12 日

第 1 回 保健医療分野における AI 活用推進懇談会

http://www.mhlw.go.jp/stf/shingi2/0000148680.html

9) 厚生労働省ホームページ:2017 年 2 月 20 日

第 2 回 保健医療分野における AI 活用推進懇談会

http://www.mhlw.go.jp/stf/shingi2/0000152457.html

Page 160: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第三章 行政ならびに産業・社会動向

- 153 -

〔2〕 健康・医療分野における ICT 活用の産業・社会動向

1. ヘルスケアならびに ICT関連産業・社会動向

高齢化社会に向け、質の高い医療の提供を目指すべく、各地域の大学を中心に医療ネッ

トワークの構築が始まっており、臨床研究での検証試験の開始が目立つ。このような背景

には、医療データの電子化システムを開発・提供、ウェアラブルデバイスの開発などの先

端技術を手掛ける企業と臨床研究を進めたい大学・医療機関側の思わくが一致したところ

があると推測される。すなわち、デジタル関連企業と医療機関の協働である。

本報告書の第 2 章第 1 節で紹介した東京大学の脇先生の糖尿病患者のスマートフォンで

の健康管理における臨床研究以外でも多くの産学連携事例が行われている。早稲田大学で

は、iPhone アプリ、「メタボウォッチ」を開発、アプリを利用した運動や食事に関する生

活習慣データについての調査研究を開始している1)。他の疾患では、キュア・アップが、

NEDO の事業で、東京大学医学部附属病院と連携し、非アルコール性脂肪肝(NASH)治

療アプリの臨床研究を開始する2)。

一方、PHR サービスを活用した健康増進、医療の質向上を実現するための例として、メ

ドピア、京都大学 環境安全保健機構 健康管理部門/附属健康科学センター、第一生命保険、

リクルートホールディングス、オムロンヘルスケアなどが、健康・医療・介護にかかわる

PHR データの利活用促進についての産学連携共同研究を開始する3)。また、ヘルケアでは

ないが、医療データの電子化という面では、富士通と国立がんセンター東病院は、治験薬

の安全性情報の収集・伝達を管理する「tsClinical DDworks21/NSADR」と、治験関連文

書を管理する「tsClinical DDworks21/TMF」を提供し、国立がん研究センター東病院で

の本格稼働を開始する4)。

このような IT 関連企業と大学・医療機関との産学連携事例は、後述する AI 活用事例に

も見受けられ、今後も、医療機関と協働は増えていくものと思われる。

一方、電子カルテを手掛けるなどの IT 企業とウェアラブルデバイスを開発する企業の

協働も見受けられる。健康管理支援サービスを展開するウェルビーとテルモでは、PHR サ

ービスで連携し、テルモの機器で測定した血糖などのデータを、ウェルビーのマイカルテ

に入力可能とし、各企業の電子化へ向けたサービスを加速していく5)。NTT は、昨年の調

査報告書で紹介した NTT と東レが開発した、着るだけで生体情報の連続計測を可能とす

る機能素材、「hitoe」を心疾患の遠隔診断に応用するという6)。

そのほか、特長的なビジネスとして、法人向けの健康医療サービスも見受けられる。例

えば、凸版印刷は、企業向け糖尿病予防サービス、「快食番人 Manager」を開始しており、

これは、食事のコントロールで糖尿病や慢性腎臓病の重症化予防に役立てるサービスであ

る7)。また、ジーンクエストは、遺伝子検査サービス事業に必要な商品設計、検体管理、

検査結果画面などをパッケージ化した法人向けサービス、「ジーンクラウド(gene cloud)」

を 2017 年 2 月より開始する8)。ソニーモバイルコミュニケーションズは、従業員の食生

活や生活習慣の改善を自動アドバイスし、仕事のパフォーマンスを発揮しやすい身体を作

ることを支援するヘルスケアサービス「Work Performance Plus(ワークパフォーマンス

プラス)」を開発し、健康経営に取り組む企業向けに、2017 年 2 月から提供する9)。本サ

ービスでは、ウェアラブルデバイス「SmartBand 2」などを用いて自動的に記録される。

Page 161: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第三章 行政ならびに産業・社会動向

- 154 -

同様に、ヘルスケアアプリを開発する Noom Inc. (米国ニューヨーク州)の日本法人であ

る Noom Japan は、地方職員共済組合愛媛県支部を始めとする地方自治体や企業と連携し、

特定保健指導に CDC(米国疾病対策予防センター)認定のヘルスケアアプリ「Noom コ

ーチ」の利用と Apple Watch などのウェアラブルデバイスの試験導入を 2017 年 2 月より

開始する10)。このアプリは、AI による学習システムやオンラインによるコーチングなど

による生活習慣の管理を行うアプリであり、糖尿病予防プログラムにおいて、医学的な減

量効果について有用であるといった検証報告がされている。

2. 製薬企業とヘルスケアビジネス

製薬企業が取り組むビッグデータ利活用では、新規創薬標的探索のほか、臨床試験の効

率化が挙げられ、海外のメガファーマでは、ビッグデータを活用し、共同研究候補や連携

先、治験候補施設を選定するシステムの開発に取り組む企業もある。また、市販後のデー

タの活用など、適応拡大の承認申請にビッグデータを活用するといった取り組みも始まっ

ているようである。

患者のモニターによるデジタルデータ収集も注目される点である。特に、患者モニター

からのデータ収集では、ウェアラブルデバイスの活用により日々のモニターが可能となり、

より患者状態が把握でき、従来ではグレーゾーンであった判定も、より明確に判定ができ

るようになると期待されている。また、医療データをはじめとした多様なデジタルデータ

の解析によって、患者や疾患がより細分化できるようになれば、新規の医薬品の創出にも

つながることも期待できる。

一方、ヘルスケアという面では、健康モニターをすることで、未病での治療といった先

制医療のような取り組みも可能となると期待されている。このようなデジタルヘルスにつ

いての取り組みは、長期的な視野で取り組む必要があるとはいえ、製薬企業のパラダイム

シフトでもあるとも指摘されている。2016 年 4 月以降の最近の取り組み事例では、GSK

が、Apple 社の ResearchKit による iPhone アプリにより、関節リウマチの可動性や身体

症状/気分を調べる試験を開始するといった報道もされている11)。国内では、大塚製薬が、

IBM と共同出資した大塚デジタルヘルスを設立した12)。米 IBM の Watson を活用し、精

神科向け電子カルテ解析システム「MENTAT」を開発し、桶狭間病院藤田こころケアセン

ターが MENTAT の稼働を開始した。また、エーザイは、MAMORIO(旧社名:株式会社

落し物ドットコム)と認知症お出かけ支援ツール、「Me-MAMORIO」の開発に関して提

携し、「Me-MAMORIO」の実用化に向けた実証実験を開始したほか、健康関連サービス

を展開するココカラファインと東京大学との共同で軽度認知症のコミュニケーションツー

ルを用いた臨床試験を開始するという13)。また、Meiji Seika ファルマは、統合失調症患

者の服薬や症状、睡眠状況を自己管理する患者向けアプリ「こころのケア」の提供を開始

し、健康管理支援サービスを展開するウェルビーの電子カルテにも連動させるという14)。

このほかにも、武田薬品工業などの国内大手製薬企業も、ヘルスケアビジネスに参入する

といった報道がされている。

上述した事例の特徴は、従来のような大学と製薬企業といった産学連携ではなく、また

製薬企業と IT 開発企業との単なる協働ではなく、健康サービスを手掛ける企業も含んだ

事業展開であり、まさに異業種協働といってよい。特に、精神疾患領域や慢性疾患などの

Page 162: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第三章 行政ならびに産業・社会動向

- 155 -

ケアを必要とされる領域が先行しており、自社の有する製品市場に関連した領域での事業

展開であることが見受けられる。情報収集の今後は、このようなヘルスケア事業から得た

データをどのように活用し、本業の医薬品開発につなげていくのか注目されるところであ

る。

3. AI活用

AI の医療への活用例としては、本報告書でも紹介している東京大学医科学研究所で実施

された IBM Watsonを用いた希少な白血病のタイプと治療法を短時間で助言した報告が有

名であるが、同様の報告は海外グループからがん領域の学会でもされている。また、IBM

Watson Health と Broad Institute が、癌の薬剤耐性獲得機構の解明と併用療法の開発に

向けた計画(5 年間/5,000 万ドル)を発表した15)(2016 年 11 月)。IBM は Watson を利

用して、Broad Institute の患者由来の数千検体のゲノムデータから、薬剤に対する感受性

と耐性を予測可能にする遺伝的パターンを探索するという。Watson に関する詳細につい

ては、本報告書第二章第 4 節で日本アイ・ビー・エム(株)でのヒアリング報告を掲載し

ており、それを参考にしてもらいたいが、学習させる情報の質も重視しているようである。

一方、独自の人工知能「KIBIT」を開発し、それを搭載したソリューションを提供してい

る FRONTEO と公益財団法人がん研究会(癌研)は、FRONTEO の開発した人工知能エ

ンジン KIBIT を活用し、がん領域のプレシジョン医療実現のための共同研究を開始すると

発表した16)(2017 年 1 月)。このプロジェクトの注目される点は、学習情報の精査であ

る。AI を精度良く活用するためには、質の高い情報を用いた学習が必要と言われており、

このプロジェクトの成果に注目したい。

がん領域以外での AI の活用については、本報告書でも紹介している慶應義塾大学にお

けるうつ病や認知症などの精神疾患の重症度を客観的評価する研究プロジェクト

「PROMPT」も挙げられるが、他の事例も多くある。東京大学と NTT が、約 900 名の糖

尿病患者の電子カルテデータを利用して、糖尿病患者の症状が悪化する原因の一つである

患者行動「受診中断」を予測するモデルを開発した。これは、電子カルテのデータや特徴

量を入力することにより、患者の受診中断リスクを AI が予測するというもので17)。、

SS-MIX2 の標準化ストレージに準拠しており、2017 年度から評価試験が開始されるとい

う。自治医科大学では、LSI メディエンスや東芝メディカルシステムズなど医療機器メー

カーなど 5 社が医師の診療を支援する AI システム「ホワイトジャック」を開発18)。患者

の症状などを入力すると、AI が考えられる病名とその確率を計算し、患者の電子カルテの

データ・診療履歴・治療法・検査法・処方薬など 8000 万件を蓄積した医療データバンク

より、想定される疾患を検索・分析・提示するという。2-3 年後の実用化に向け、検証試

験開始予定である。また、NEC では、AI 深層学習として、電子カルテを NEC の機械学

習ソフトウエア RAPID で解析し病名予測できるシステムを発表している19)。上述した桶

狭間病院藤田こころケアセンターでは、日本 IBM、大塚製薬と共同で米 IBM の Watson

を活用した精神科向け電子カルテ解析システム「MENTAT」を 2016 年 7 月から稼働を開

始している12)。また、第一生命保険と藤田保健衛生大学は、2004 年以降の患者約 98 万

人分のカルテ情報(検査データ、症状、病歴など)を IBM Watson により分析して糖尿病

患者の発症リスクの予測や重篤化を防止する健康改善、治療モデルの構築に向け検討を開

Page 163: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第三章 行政ならびに産業・社会動向

- 156 -

始する20)。一方、創薬関連では、NEC が独自の AI 技術群「NEC the WISEAI」を用い

た新薬候補物質の探索ならびに実用化を支援する創薬事業を開始するため、がん治療用の

ペプチドワクチンを開発・実用化を推進する新会社「サイトリミック」を設立した21)。

ここまで、健康・医療分野における ICT 活用の産業・社会動向を紹介してきた。これら

の特徴を整理すると、産官を含む異業種連携がすべてに共通する。製薬企業と比べ、ベン

チャー企業や IT 企業は、フットワークが良いのか、多くの異業種連携を行っている。し

かしながら、課題も予想される。各医療機関が独自で、IT 関連企業と連携してシステム構

築などを行っている。同様に、ウェアラブルデバイスの開発や活用も、各企業や機関が独

自で連携して行っている。すなわち、結果のフォーマットや出力形式が、個々に異なる可

能性も生まれる。コンシューマ向けの健康管理であれば、問題ないかもしれないが、医療

となるとそうはいかない。今後、医療データなどの利活用については法整備などが行われ

るようであるが、デジタルヘルスケアの産業のスピードは目覚ましく、共通の形式が提唱

される前に、検証結果とその有用性が実証されるとも限らない。ヘルスケア産業の活性化

とともに、起こりうる課題の改善に対し、効率よく早期に取り組むためには、各省が連携

して努めることが必要であると考えられる。

4. AI コンソーシアム

(1)ライフ インテリジェンス コンソーシアム、 LINC(Life Intelligence Consortium)

昨年、創薬 AI で 50 社連合といった報道があったが、2016 年 11 月に設立されたこの

50 社連合がライフ インテリジェンス コンソーシアム LINC である22)。

LINC では、アカデミアとの連携により、製薬・化学・食品・医療・ヘルスケア関連の

ライフサイエンス分野のための AI ならびにビッグデータ技術の開発に取り組み、IT 業界

とライフサイエンス業界の連携を促進し、IT 企業の国際的な AI 産業競争と AI 戦略によ

るライフサイエンス業界の産業競争力を加速することを目指すとしている。代表に、京都

大学/理研の奥野恭史教授、事務局として公益財団法人都市活力研究所、特定国立研究開

発法人理化学研究所 健康生き活き羅針盤リサーチコンプレックス推進プログラム(理研

RCH)、国立大学法人京都大学大学院医学研究科 人間健康科学系専攻ビッグデータ医科学

分野の 3 機関、事務局長:江口至洋氏(理研 RCH)にて運営されている。LINC の主要構

成メンバーは、AI を開発する企業・アカデミア(主に IT 系)と AI を利活用する企業・

アカデミア(主に製薬・化学・食品・医療・ヘルスケア関連のライフ系)となっている。

参画だけして情報だけをもっていく企業は排除するとし、各企業から実働できる人材の参

画を義務付けている。

具体的には、pre-competitive ステージ研究として、ライフサイエンス企業からのテーマ

設定(創薬標的探索など)後、各企業が公共データなどの基盤整備を IT 企業の助言のも

と実施し、IT 系企業がモデル AI を開発する。続いて、competitive ステージとして、各

企業の自社保有データを使って、開発した AI の検証を実施し、自社で改良をしていくと

いった計画である。課題ごとに WG を設置してテーマを設定し、2017 年 5 月末を目途に

テーマの選定を行う計画のようである。2017 年 6 月まで参画企業の募集を行っており、

特に国内の IT 企業、アカデミアのさらなる参画を望んでいるようである。

Page 164: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第三章 行政ならびに産業・社会動向

- 157 -

今後、医療や医薬品開発に AI を活用していくための重要な要素は、IT 研究者が自身の

基準でアルゴリズム等の開発をするのではなく、ライフサイエンスの研究者との連携を深

め、より実用的な AI の開発をすることであり、このコンソーシアムが目指すところでも

あるかと思われ、大いに期待したい。

(2)人工知能技術コンソーシアム

医療やライフサイエンス分野に限定したコンソーシアムではないが、2015 年に国立研究

開発法人産業技術総合研究所(産総研)の人工知能技術研究センターが設立され、それに

伴い産総研を中心とした産学のコンソーシアムが設立された23)。データ活用の共創的価

値創出を加速させ、実社会への展開事例の創出を推進することを目的としている。国立研

究開発法人 産業技術総合研究所人工知能研究センター内に人工知能技術コンソーシアム

事務局を設置し運営している。2017 年 3 月現在で、約 60 社・機関が参画しているが、医

療関連企業・機関は少ないようである。

5. マイクロバイオーム標準化コンソーシアム

マイクロバイオームの種々の測定、解析法の標準化を目指し製薬企業や食品企業など 17

社で構成される「マイクロバイオームコンソーシアム組成準備ワーキンググループ」が

2016 年秋に設立された。2016 年 12 月 22 日、第 1 回ワークショップを開催し、企業以外

にアカデミアの研究者や日本医療研究開発機構(AMED)などの行政関係者も参加し、意

見交換が行われた。2017 年 4 月にコンソーシアムの設立を目指している24)。

【参考資料】

1) 早稲田大学 ホームページ:2016 年 6 月 15 日 ニュース

https://www.waseda.jp/top/news/42944

2) 東京大学 ホームページ:2016 年 9 月 30 日 プレスリリース

http://www.h.u-tokyo.ac.jp/press/press_archives/20160930.html

3) メドピア ホームページ:2016 年 7 月 11 日 プレスルーム

https://medpeer.co.jp/press/2701.html

4) 富士通 ホームページ:2017 年 2 月 16 日 プレスリリース

http://pr.fujitsu.com/jp/news/2017/02/16-1.html

5) ウェルビー ホームページ:2016 年 4 月 27 日 プレスリリース

https://welby.jp/post-8393/

6) NTT ホームページ:2016 年 9 月 28 日 ニュースリリース

http://www.ntt.co.jp/news2016/1609/160928a.html

7) 凸版印刷 ホームページ:2016 年 7 月 6 日 ニュースリリース

http://www.toppan.co.jp/news/2016/07/newsrelease160706.html

8) ジーンクエスト ホームページ:2016 年 12 月 8 日 ニュースリリース

https://genequest.jp/topics/news/0/214

9) ソニーモバイルコミュニケーション ホームページ:2017 年 2 月 9 日

ニュースリリース

Page 165: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第三章 行政ならびに産業・社会動向

- 158 -

http://www.sonymobile.co.jp/company/press/entry/2017/0209_1_wpp.html

10) 愛媛県 ホームページ:2017 年 1 月 17 日 県政情報

https://www.pref.ehime.jp/h10780/tikyosaiitkatuyou/itkenkouzukuri.html

11) GSK(US) ホームページ:2016 年 7 月 8 日

http://us.gsk.com/en-us/behind-the-science/innovation/can-an-iphone-transform-

the-way-we-monitor-and-improve-patient-health/

12) 大塚製薬 ホームページ:2016 年 6 月 13 日 ニュースリリース

https://www.otsuka.co.jp/company/release/detail.php?id=3117

13) エーザイ ホームページ:2016 年 8 月 1 日 ニュースリリース

http://www.eisai.co.jp/news/news201656.html

14) MeijiSeika ファルマ ホームページ:2016 年 6 月 29 日 プレスリリース

http://www.meiji-seika-pharma.co.jp/pressrelease/2016/detail/160629_01.html

15) IBM ホームページ:2016 年 11 月 10 日 News releases

http://www-03.ibm.com/press/us/en/pressrelease/51032.wss#feeds

16) FRONTEO ホームページ:2017 年 1 月 31 日 プレスリリース

http://navigator.eir-parts.net/EIRNavi/DocumentNavigator/ENavigatorBody.asp

x?cat=tdnet&sid=1434473&code=2158&ln=ja&disp=simple

17) NTT ホームページ:2017 年 2 月 3 日 ニュースリリース

http://www.ntt.co.jp/news2017/1702/170203a.html

18) 自治医科大学 ホームページ:2016 年 7 月 NewsLetter

http://www.jichi.ac.jp/openlab/newsletter/letter107.pdf

19) 日経デジタルヘルス 2016 年 7 月 19 日

http://techon.nikkeibp.co.jp/atcl/event/15/063000072/071600017/?ST=health

20) 第一生命保険 ホームページ:2016 年 7 月 14 日 ニュースリリース

http://www.dai-ichi-life.co.jp/company/news/pdf/2016_028.pdf

21) NEC ホームページ:2016 年 12 月 19 日 プレスリリース

http://jpn.nec.com/press/201612/20161219_02.html

22) 理化学研究所 健康生き活き羅針盤リサーチコンプレックス ホームページ:

2016 年 11 月 17 日 お知らせ

https://rc.riken.jp/news/161117lincestab/

23) 人工知能技術コンソーシアム ホームページ:

http://www.airc.aist.go.jp/consortium/

24) 日経バイオテク ONLINE:2016 年 11 月 14 日、2017 年 1 月 12 日

https://bio.nikkeibp.co.jp/atcl/news/p1/16/11/10/01850/

https://bio.nikkeibp.co.jp/atcl/news/p1/17/01/11/02140/

Page 166: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第三章 行政ならびに産業・社会動向

- 159 -

〔3〕 ゲノム医療実現へ向けた行政の取組み

1.健康・医療戦略推進本部

2017 年 2 月 17 日に、第 17 回の健康・医療戦略会議が開催され、医療分野研究開発推

進計画の見直し案にある 2020 年度までの達成すべき成果目標として、ゲノム医療につい

ては、以下の 4 項目が掲げられている1)。

① 糖尿病などに関するリスク予測や予防、診断や治療、薬剤の選択・最適化等に係

るエビデンスの創出

② 発癌予測診断、抗がん剤などの治療反応性や副作用の予防診断にかかわる臨床研

究の開始

③ 認知症・感覚器系領域のゲノム医療にかかわる臨床研究の開始

④ 神経・筋難病などの革新的な診断・治療法にかかわる臨床試験の開始。

2.ゲノム医療実現推進協議会

ゲノム医療実現推進協議会についてのこれまでの取組みついては、2015 年度の報告書で

も行政の取組みの一つとして紹介してきた。本協議会では、計 4 回の議論を経て 2016 年

7 月、求められる取組みとして 4 分類 29 項目の「中間とりまとめ」案が作成された2)。そ

の後、第 5 回協議会(2016 年 8 月)では「中間とりまとめ」の実行状況と取組み方針に

ついて厚労省及び AMED から報告と意見交換が行われ、第 6 回の協議会では求められる

取組み 29 項目を整理するための議論がされた。そのような討議の末、実行状況と具体的

な対象疾患の設定と目標・工程案について、その方向性についての取り纏め案を公開した。

前提となる対象疾患については、「中間とりまとめ」において、ゲノム情報等と疾患との

関連について、「比較的エビデンスが蓄積されており、医療への実利用が近い疾患・領域で

あり、着実に推進する必要がある」第 1 グループと、「(医療への実利用は近くないが、)

多くの国民が罹患する一般的な疾患への対応にゲノム情報等を応用する」第 2 グループに

整理されていた。その後、AMED のゲノム医療研究推進ワーキンググループにて、推進す

べき対象疾患の設定等について検討を行い、2016 年度以降に AMED で実施されるゲノム

医療の実現に向けた各種事業内容の検討に資することを念頭に、第 1 グループでは、単一

遺伝子疾患、希少疾患・難病、認知症、感染症で、第 2 グループでは、糖尿病や循環器疾

患の予防に加え、中間とりまとめでは明確ではなかった、がん、感染症、自閉症スペクト

ラム、うつ病、統合失調症、認知症、アレルギー疾患などの、多数の遺伝子変異が複合的

に関係し、環境要因の影響を受けるなど多因子が関与する疾患についても、必要に応じて

第 2 グループでも扱うべき、とされた。

その後、第 7 回のゲノム医療実現推進協議会が 2017 年 2 月 15 日に開かれ、ゲノム医療

の実現に向けた対象疾患の考え方として、診断・治療を目指す第 1 グループ、予防を目指

す第 2 グループの考え方に加え、さらに「基礎となる長期の基盤的研究が必要なグループ」

や「5 年以内に実用化への臨床試験に移行が見込めるグループ」5 年以内に医療実用化が

見込めるグループ」に分類し進捗管理を行い、必要に応じて見直しいていくことを公表し

た3)。また、同時に個人情報保護法等の改正に伴う研究倫理指針の見直しについても議論

された。なお、個人情報保護法等の改正についての詳細は、本報告書の第二章第 1 節を参

Page 167: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第三章 行政ならびに産業・社会動向

- 160 -

考にして頂きたい。

3.ゲノム情報を用いた医療等の実用化推進タスクフォース

ゲノム情報を用いた医療等の実用化推進タスクフォースは、2015 年 11 月 17 日に第 1

回の検討会が開催され、第 3 回の検討会までに、改正個人情報保護法におけるゲノムデー

タ等の取扱いについて議論され、昨年度の報告書にも紹介してきた。その後の検討会につ

いては、以下のとおり、それぞれの議題について討議された。

表1. ゲノム情報を用いた医療等の実用化推進タスクフォースの検討会開催状況

委員会 開催日 議事内容

第4回 2016 年 1 月 27 日 ・ゲノム医療に関連する施策について

・医療における遺伝子検査について

・消費者向け遺伝子検査ビジネスについて

第 5 回 2016 年 2 月 18 日

・医療における遺伝子関連検査の品質・精度の確保に

ついて

第 6 回 2016 年 3 月 11 日 ・ゲノム医療の提供のあり方について

・今後の研究開発の方向性について

第 7 回 2016 年 3 月 30 日 ・ゲノム医療の質の確保について

・消費者向け遺伝子検査ビジネスについて

第 8 回 2016 年 6 月 1 日

・ゲノム医療等の質の確保について

・ゲノム医療等の実現・発展のための社会環境整備に

ついて

第 9 回 2016 年 7 月 22 日 ・ゲノム医療等の実現・発展のための社会環境整備に

ついて

2016 年 10 月 19 日 ・ゲノム医療等の実現・発展のための具体的方策につい

ての報告書(意見とりまとめ)公開

最終的に、2016 年 10 月 19 日に、ゲノム医療等の実現・発展のための具体的方策につ

いての報告書、「ゲノム医療等の実現・発展のための具体的方策について(意見とりまとめ)」

を公開し、①改正個人情報保護法におけるゲノム情報の取扱いについて、②「ゲノム医療」

等の質の確保について、③「ゲノム医療」等の実現・発展のための社会環境整備の 3 項目

について、取り纏めている(図 3)4)。

「意見取りまとめ」の中で、ゲノム医療の実現に向けての取り組む課題については、遺

伝子検査関連の品質・精度の確保、患者・家族への情報提供、ゲノム医療に従事する者の

育成を挙げている。遺伝子検査関連の品質・精度の確保においては、医療保険制度の中で、

ゲノム情報を用いた診断や治療を保険診療として位置付けるためには、遺伝子関連検査の

品質・精度を確保する必要があるとし、「遺伝子検査関連の品質・精度を確保するためには、

遺伝子関連検査に特化した日本版ベストプラクティス・ガイドライン等、諸外国と同様の

水準を満たすことが必要であり、厚生労働省においては関係者の意見等を踏まえつつ、法

令上の措置を含め具体的な方策等を検討・策定していく必要がある」と議論の結果をまと

めている。一方、患者・家族への情報提供については、遺伝カウンセリングの重要性や偶

発的所見等の取扱いに関する内容が中心であり、「ゲノム情報を用いた医療の普及に当たっ

Page 168: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第三章 行政ならびに産業・社会動向

- 161 -

ては、遺伝子検査(特に遺伝学検査)の実施に際して、患者やその家族等に対して必要と

される説明や留意事項を明確化し、医師等に対して周知が行われる必要がある」と結果を

纏めている。その中で、偶発的所見等の取扱いについては、診断目的の遺伝子変異などの

検査で得られる情報、研究の中の主目的として得られた情報、二次的所見として得られた

情報、と偶発的に副次的に得られた情報は、情報精度などに関する違いがあることを前提

するといった補足もされている。

図3.ゲノム情報を用いた医療実用化に関する検討の流れ

(厚生労働省ホームページより4))

【参考資料】

1) 首相官邸ホームページ:2017 年 2 月 17 日 第 17 回健康・医療戦略推進本部会議

資料 2 「医療分野研究開発推進計画」一部変更案

http://www.kantei.go.jp/jp/singi/kenkouiryou/suisin/suisin_dai17/siryou2.pdf

2) 首相官邸ホームページ:ゲノム医療実現推進協議会

ゲノム医療実現推進協議会 中間取り纏め

http://www.kantei.go.jp/jp/singi/kenkouiryou/genome/pdf/h2707_torimatome.pdf

3) 首相官邸ホームページ:2017 年 2 月 15 日 第 7 回ゲノム医療実現推進協議会資料

http://www.kantei.go.jp/jp/singi/kenkouiryou/genome/dai7/gijisidai.htm

4) 厚生労働省ホームページ:2016 年 10 月 19 日

ゲノム情報を用いた医療等の実用化推進タスクフォース

「ゲノム医療等の実現・発展のための具体的方策について(意見とりまとめ)」

http://www.mhlw.go.jp/file/05-Shingikai-10601000-Daijinkanboukouseikagakuk

a-Kouseikagakuka/0000140440.pdf

Page 169: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第三章 行政ならびに産業・社会動向

- 162 -

〔4〕 コホート研究ならびにゲノム技術等における研究動向

1. 国内のコホート研究・バイオバンクの最新動向

(1)東北メディカル・メガバンク機構

2014 年度の HS 創薬資源報告書において、東北メディカル・メガバンク機構の概要・取

組みについて紹介した。コホート研究の成果は、長い年月を要する上に、データ解析の複

雑性もあり、頻繁に成果がでるものではない。そのような中、同機構では、解析技術の開

発、データ収集、管理、利活用などの、プラットフォーム整備を確実に進めているという。

以下が今年度の代表的成果である。

表2.東北メディカル・メガバンク機構の最近の成果

発表年月 内容

2016 年 7 月

複数の研究機関が持つゲノムデータを相互に開示せず分析する解析手法

を開発。プライバシー保護データマイニング技術によるフィッシャー正確

確率検定法1)。

2016 年 8 月

日本人多層オミックス参照パネル(jMorp)を拡張。メタボロームの解析

人数が 1008 人に。項目間相関情報・ペプチド情報を追加2)。

2016 年 12 月 バーチャルプライベートネットワーク(VPN)回線を用い、セキュリティ

ーを担保した上で外部機関からスーパーコンピュータにアクセスできる

システムを構築。まず、東京大学大学院医学系研究科人類遺伝学分野と国

立成育医療研究センターに入室を生体認証で厳重に管理された部屋を設

置し、専用のクライアント端末よりアクセスできる仕組みを整備3)。

2017 年 1 月 これまでの GWAS のみを利用する手法ではなく、測定したすべての遺伝

子多型を用いた新規のリスク計算手法、iPGM(iwate polygenic model)

法を開発し、脳梗塞発症リスク予測に応用4)。

2017 年 2 月

「脳と心の健康調査」への参加者、2016 年 12 月末現在で 4016 人参加。脳

MRI 検査、認知検査、対面式心理検査などの調査で、MRI 検査では国内

最大規模。単一施設、単一プロトコールでの実施された大規模データベー

スで、国内外の研究機関が活用できるよう公開予定。今後、1 万人登録を

目指す5)。

2017 年 2 月

SNP アレイで解析し遺伝型決定が行われた約 1 万人分の生体試料・情報

を、2 月下旬より分譲開始。1 万人規模の地域住民の DNA、血漿、血清と

健康調査情報および SNP アレイ情報の分譲は、日本初。2017 年度には、

血漿オミックス解析対象者の生体試料・情報約 1,000 人分および 2,049 人

分の日本人ヒト全ゲノム解析に基づく高精度の住民ゲノム参照パネルの

対象者等の生体試料・情報の分譲開始を予定。大学機関のほか、日本に本

社のある企業を対象としており、この意味は大きく、オールジャパンでの

利活用・成果に貢献できるものと期待したい6)。

Page 170: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第三章 行政ならびに産業・社会動向

- 163 -

(2)ナショナルセンター・バイオバンク・ネットワーク(NCBN)

6 つの国立高度医療専門研究センター(6NC)が個別に構築していた疾患バイオバンク

をネットワークする目的で、2011 年に NCBN が発足、中央バイオバンクを設置すること

により、6NC の情報をデータベース(カタログ DB)として整備するとともに、試料はロ

ーカルのバイオバンクが保管・管理し、その利活用の促進を進めてきた。

発足後 5 年が経過したことから、「6NC バイオバンク将来構想ワーキンググループ」が

設置されて進捗状況の整理、課題の整理、ロードマップの見直し等が行われ、2016 年 10

月に報告書が提出された7)。2017 年度からの第 2 期においては、患者・疾患レジストリを

基にしたオンデマンド対応、NC 横断的課題への取組み、ゲノム医療実現への貢献等を統

合して、「医療実装型疾患統合バンク」への発展を目指すことが提案された。これまでの「生

体試料バンク」に、医療実装のために患者-疾患(臨床)情報(データバンク)を加えて、

多様なニーズ・用途に対応できる機能統合型のバイオバンクを目指すとしている。さらに

は企業治験、医師主導治験、臨床研究に展開可能なインフラも整備するとしている。

2. 海外のゲノム医療・ゲノム技術に関する動向

関連する海外動向について以下に紹介する。

(1)23andMe

23andMe は Google が出資している米国大手で世界屈指の DNA 解析会社であり、消費

者向け遺伝子検査の先駆けである。世界中の多様な遺伝データを積極的に収集し、その領

域でトップを目指すとしている。今後、人種の多様性を反映させた遺伝情報の収集を計画

しているという。現在、アフリカ系アメリカ人の遺伝情報の収集やアフリカにおける 2 つ

のプロジェクトも進行中で、祖先を構成する遺伝データの多様性の解析を進めるものと思

われる。解析サービス事業としては、研究者向けに、被験者由来検体からのジェノタイピ

ングを行うサービスも開始。一方、疾患関連 SNP の解析も積極的に行っており、以下に

今年度報告があった事例を紹介する。

Nature Communications | 7:12048 | DOI: 10.1038/ncomms12048

スタンフォード大との共同研究で、23andMe の顧客データのうち、患者 7,404 人、

対象となるコントロールが 292,076 人といった大規模の全ゲノム解析により、皮膚

がんのうち扁平上皮がん発症に関連する 14 個の SNP を同定。

Nature Communications | 7:12510 | DOI: 10.1038/ncomms12510

スタンフォード大との共同研究で、23andMe の顧客データのうち、患者 17,187 人、

対象となるコントロールが 287,054 人といった過去最大規模の全ゲノム解析により、

皮膚がんのうち基底細胞がん発症に関連する 31 個の SNP を同定。そのうち 14 個

は新規。

Nature Genetics 48, 1031–1036 (2016) | doi:10.1038/ng.3623

Pfizer との共同研究で、白人における大うつ病リスクとゲノム全域の 15 領域の 17

の SNP が関連。

Page 171: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第三章 行政ならびに産業・社会動向

- 164 -

(2)Precision Medicine Initiative

2015 年 1 月にオバマ前大統領により Precision Medicine Initiative(PMI)が発表され、

その中で、100 万人以上のボランティアによる全米規模での研究コホート実施が掲げられ

た。2016 年度の PMI 関連の予算総額は 2.15 億ドル(約 250 億円)で、そのうちコホー

ト研究に 1.3 億ドルが配分されている。NIH は、2016 年 7 月に、PMI Cohort Program

の実施機関を選定し、準備を開始すると発表している8)。ボランティア 100 万人以上を募

集する取組みを立ち上げ、医療機関、技術開発者などに対し、NIH から 5,500 万ドルを助

成するという(2016 年からの 5 年間で、予算は 5,500 万ドル/2016 年)。データへのアク

セスと使用を可能とするための技術開発も行う。しかしながら、大統領が交代したことで、

今後のプロジェクトの動向については見極める必要がある。

(3)米国癌学会 GENIE プロジェクト

米欧の GENIE プロジェクトに参画している 8 機関の間のシーケンシング、診断プロト

コール、サンプル間差などを調整した 18,486 人の癌患者由来のゲノムデータと限定的な

臨床データの公開を発表9)。

(4)英国の「10 万人ゲノム・プロジェクト」

英国のゲノム医療の国家プロジェクトである「10 万ゲノム・プロジェクト(100,000

Genomes Project)」に取り組んでいる GenomicsEngland は、2013 年に同プロジェクト

を開始、2017 年末までにがんおよび希少疾患を中心に患者約 7 万人とその家族約 3 万人

の計 10 万人分のゲノムデータを国内の 13 か所の NHS Genomic Medicine Centre と連携

し収集・解析する。当初 5 年間で 3 億ポンド(約 500 億円)の予算を配分した。シーク

エンシングは Illumina と協働をして行っていたが、さらに 2016 年 2 月 11 日、Illumina

と GenomicsEngland とパートナーシップ締結すると発表し、パートナーシップの条件と

して、Illumina は、プロジェクトでシーケンスを行ったすべてのゲノムに対し、クリニカ

ルアノテーションおよびレポート作成を行うツールを開発する一方、GenomicsEngland

は、全ゲノム配列情報や特定されない表現型に関するデータへのアクセス権を Illumina

に付与するとしている。当プロジェクトでは、2017 年 3 月現在でゲノムシークエンスを

行った人数が 20,000 人を超えたと報告しており、予定どおり 10 万人のゲノムデータの解

析はできるとコメントされている10)。

(5)Illumina の取組み

GenomicsEngland 以外での Illumina の取組みとしては、2017 年 1 月 9 日に、同時に 3

件の報道発表を行い、一つには IBM とゲノムデータの解釈を標準化するための協業を発

表。また、1 日 100 ドルでヒトゲノム解析実現へ向けての新シークエンサーNovaSeq シリ

ーズを発表。さらに、BioRad と複雑な疾患研究を支援するシングルセルゲノムシークエ

ンシングのためのソリューションを発売。データ解析から、用途に応じたシークエンシン

グソリューションを提供していくとしている11)。

Page 172: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第三章 行政ならびに産業・社会動向

- 165 -

【参考資料】

1) 東北メディカル・メガバンク機構ホームページ:2016 年 7 月 12 日

「複数の研究機関が持つゲノムデータを相互に開示せず分析する手法を開発」

http://www.megabank.tohoku.ac.jp/wp/wp-content/uploads/2016/07/ID16271_pres

srelease.pdf

2) 東北メディカル・メガバンク機構ホームページ:2016 年 8 月 29 日

「日本人多層オミックス参照パネル(jMorf)を拡張

http://www.megabank.tohoku.ac.jp/wp/wp-content/uploads/2016/08/ID17206_pres

srelease.pdf

3) 東北メディカル・メガバンク機構ホームページ:2016 年 12 月 21 日

「遠隔セキュリティルーム運用開始 -外部研究機関からもスーパーコンピュータが

利用可能に」

http://www.megabank.tohoku.ac.jp/wp/wp-content/uploads/2016/12/ID18851_web_

tohokuuniv-press20161221.pdf

4) 東北メディカル・メガバンク機構ホームページ:2017 年 1 月 19 日

「遺伝的体質に基づく新しい「脳梗塞発症リスク予測法」を開発~脳梗塞の予防に貢

献可能」

http://www.megabank.tohoku.ac.jp/wp/wp-content/uploads/2017/01/ID19034_pres

srelease.pdf

5) 東北メディカル・メガバンク機構ホームページ:2017 年 1 月 19 日

「東北メディカル・メガバンク機構 「脳と心の健康調査」への参加者が 4,000 人に

到達 –進捗報告と今後の展望の紹-」

https://www.tohoku.ac.jp/japanese/newimg/pressimg/tohokuuniv-press20170216_0

4web.pdf

6) 東北メディカル・メガバンク機構ホームページ:2017 年 2 月 21 日

「1万人分の SNPアレイ情報の分譲を開始 –生体試料および健康調査情報が分譲へ」

http://www.megabank.tohoku.ac.jp/wp/wp-content/uploads/2017/02/ID19784_news

_pressrelease02.pdf

7) NCBN ホームページ: 2016 年 10 月

「6NC バイオバンク将来構想ワーキンググループ報告書」

http://www.ncbiobank.org/report_new_roadmap_201610.pdf

8) 米国 White House ホームページ: 2016 年 7 月 7 日

“Fact Sheet: Administration Announces new Actions to Advance the President ’s

Precision Medicine Initiative”

https://obamawhitehouse.archives.gov/the-press-office/2016/07/06/fact-sheet-admi

nistration-announces-new-actions-advance-presidents

9) American Association for Cancer Research ホームページ:2017 年 1 月 5 日

“AACR Project GENIE Publicly Releases Large Cancer Genomic Data Set”

http://www.aacr.org/Newsroom/Pages/News-Release-Detail.aspx?ItemID=994#.HA

debaLTxI

Page 173: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第三章 行政ならびに産業・社会動向

- 166 -

10) Genomics England ホームページ:2017 年 3 月 6 日

“The 100,000 Genomes Project by numbers”

https://www.genomicsengland.co.uk/the-100000-genomes-project-by-numbers/

11) Illumina ホームページ:2017 年 1 月 9 日

① “IBM and Illumina Partner to Standardize Genomic Data Interpretation”

https://www.illumina.com/company/news-center/press-releases/press-release

-details.html?newsid=2234854

② “Illumina Introduces the NovaSeq Series—a New Architecture Designed to

Usher in the $100 Genome”

https://www.illumina.com/company/news-center/press-releases/press-release

-details.html?newsid=2236383

③ “Illumina and Bio-Rad Launch Solution for Single-Cell Genomic Sequencing

to Enable Robust Study of Complex Diseases”

https://www.illumina.com/company/news-center/press-releases/press-release

-details.html?newsid=2236389

Page 174: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第四章 考察

- 167 -

第四章 考察

本調査班では、創薬ならびに先制医療・予防医療等のヘルスケアや個別化医療にも注目

し、2014 年度はコホート研究の動向を中心に調査を行い、2015 年度は医療分野のビッグ

データ、オミックス研究、バイオマーカーに焦点をあて、一部ウェアラブルデバイスにつ

いても触れ、事例も加えた総論的な報告を行った。本年度の調査報告においては、医療分

野のビッグデータの利活用に焦点をあて、医療情報の収集・整備・利活用、ビッグデータ

解析における人工知能(AI)の活用と医療応用、オミックスデータ等を活用したドラッグ

リポジショニングの事例、先制医療・予防医療へのマイクロバイオームの活用の可能性な

どにも言及した。以下に、このような医療分野のビッグデータの活用に関して、今後のあ

るべき姿を念頭に置き、考察を加えた。

1. 臨床情報の創薬への活用

カルテやレセプトから得られる医療情報、並びにウェアラブル機器やモバイル機器から

得られる医療・健康関連の生活圏データ(ライフデータ)といったビッグデータを、人工

知能(AI)を用いて解析し、新たな診断方法の確立、健康管理、創薬等に繋げるという試

みが行われている。今回、我々は、大江和彦 教授(東京大学大学院医学系研究科 医療

情報学分野)、脇 嘉代 特任准教授(東京大学大学院医学系研究科 社会連携講座 健康

空間情報学講座 医学部附属病院糖尿病・代謝内科)及び岸本泰士郎 専任講師(慶応義

塾大学医学部 精神・神経科学教室)から、各研究室における最新のトピックスを入手し、

医療情報やライフデータの利活用に関する現状を把握するとともに、今後の課題、将来性

について検討した。

医療情報は種々の手法により収集され、膨大な量になってきているが、研究者がこれら

の医療ビッグデータを有効利用するための環境は十分に整っておらず、思うように研究が

進んでいない。例えば、カルテへの記載方法は標準化されておらず、医師個人個人により

異なるフォーマット、異なる表現が使われており、また電子カルテのシステム間の規格統

一も取れていない。統一された ID が無く、使用される語彙もばらばらで、医師の記述、

使用用語を採用するしか方法がなく、用語の統一(カルテ記載方法の標準化)を進める必

要性は大きい。電子カルテ間の統一については、規格が異なる各社電子カルテ情報を標準

化して格納するシステムである SS-MIX2 標準化ストレージが開発され、このシステムを

用いることにより、多目的臨床データ登録システム(MCDRS)を利用した学会主導の臨

床データベースへのデータ登録の省力化・効率化や医療情報データベースシステム基盤整

備事業(MID-NET)等の実施が可能となってきたが、更なるデータの標準化、統一化に

向けた取組みが望まれる。

近年急増しているライフデータは、主としてウェアラブル機器やモバイル機器を通して

収集されるが、このような情報通信技術(ICT)の医療への応用は、ようやくスタートラ

インに立ったところである。ICT 医療を更に普及させるためには、その医療上の価値を一

般に啓発するとともに、医学的エビデンスを積み上げていくことが重要であるが、これら

Page 175: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第四章 考察

- 168 -

の機器の普及率には世代間格差や所得間格差があるため、一般的な医療プラットフォーム

となるためには、時間が必要と思われる。

臨床研究にウェアラブル機器を用いる医療の最大の課題は継続性であるということが明

らかとなった。継続性の問題を解決するためには、ICT を用いた医療に効果があることを

しっかりと示し、患者に認知、実感してもらうことに加え、副作用等の問題が起きた際に

はすばやく対処できる体制を整備することが重要である。有効性と安全性を十分に担保す

ることができれば、患者も信頼して継続使用するものと思われる。このようにして得られ

る様々なライフデータについても、医療情報と同様、データの標準化やデータの質が重要

になると考えられる。データの質という観点では、将来、ウェアラブル機器については一

定の基準を満たした機器を認定するような制度が必要になるかもしれない。

臨床情報として得られる膨大なビッグデータを AI で処理するには、現場で収集される

データが統合され、データの形式や質が標準化されている必要があるが、現状では、医療

情報は医療現場に分散化し、医療現場任せの記入形式なのでデータ品質がばらついており、

またそのほとんどが非構造化データとなっている。また、ライフデータについても、ウェ

アラブル機器やモバイルアプリ等が標準化されていないため、やはりデータの品質はばら

ばらである。今後、これらの臨床情報を創薬にも応用していくためには、AI 技術を有効に

使うことができる「質と構造」を持つ臨床情報を生成、収集する技術を開発し、収集され

たデータの利用環境を整備することが必要である。

ビッグデータではないものの、限られた量の臨床情報を診断、治療、創薬、健康管理等

に応用するという研究は多くの研究室で進められている。モバイル機器を用いた糖尿病患

者の生活指導の例では、モバイル機器とアプリを使いながらタイムリーな結果のフィード

バックを受けることにより、より具体的に生活上の問題点を捉えることができ、健康に対

する意識を高められるという、従来の医療にはないメリットがあることが明らかとなった。

実際、本試験に参加した患者において、試験終了後も食物繊維の摂取量の増加と炭水化物

の摂取量の減少が継続する等の行動変容に繋がっている。このような行動変容は、病気に

なってから治療を始めるのではなく、健康な時から病気を防ぐという自己管理が可能とな

り、疾患への罹患そのものが減少することも期待できる。また、物忘れなどの自他覚的な

臨床所見が発現する前から、ウェアラブル機器を用いて長期に渡り身体活動等を計測する

ことで、認知症発症のリスクマーカーや生活習慣と疾病の関連性が明らかになり、予防や

介入が可能になるかもしれない。このようなヘルスケアに関する試みは、大学単独でなく、

健康管理サービスを手掛ける企業、IT 関連企業と大学が連携し、開始されているケースが

多く見られるようになってきており、製薬企業でも精神疾患領域や代謝性疾患など各企業

の指向領域について、健康管理モバイルサービスと連携し、データ収集が開始されている。

将来的には、より大規模なデータを用いた臨床研究や前向きコホート研究により、生活習

慣や生活環境と疾病との関連性が検証され、新しい予防法や治療法、更には新しい治療薬

の開発に繋がることを期待する。

臨床情報を扱う上で、臨床情報そのものや解析・診断結果等には、個人情報が多く含ま

れるため、倫理的・法的・社会的問題(ELSI:Ethical Legal and Social Issues)への配

慮が必要である。目的外の使用は避けるべきであることは言うまでもないが、どのような

配慮が必要かについては事例ごとの対応となり、開発者自身が慎重に対応しなければなら

Page 176: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第四章 考察

- 169 -

ない。個人情報を扱う上での法整備も必要である。また、個人情報保護からの制約による

データ提供の難しさや、データ標準化が不十分であるといった課題もある。

ICT を用いたデータ収集や AI を用いたデータ解析を医療に応用し実用化するためには、

医薬品医療機器等法の規制をクリアし、医療機器として認可される必要がある。例えば、

うつ病の診断システムについては、既に医薬品医療機器総合機構(PMDA)との相談も開

始されている。さらに、PMDA と日本医療情報学会との間で、機械学習や AI を使った医

療機器の承認条件等についてのガイドライン作成の検討も開始されたとのことであり、早

急なガイドライン作成並びに関連法規の整備が望まれる。

臨床情報を医療へ応用するにためは、使われるデータの質の標準化、データを収集する

ICT 機器やデータを解析する AI システムの医療機器としての承認要件の整備等の課題が

あることが明らかとなった。現状では、限られた臨床情報を健康管理や診断に応用する取

組みは散見されるものの、まだまだ、直接創薬に繋がるような研究は進んでいない。近い

将来、先に述べた課題がクリアされ、新たな治療法の開発や創薬に繋がることを期待する。

2. オミックスデータの創薬への活用

オミックスデータからの創薬研究は DNA, RNA, タンパク質、代謝産物など多岐にわた

り、それぞれの分析対象において多くの研究発表がなされている。

ゲノム解析技術だけでなく質量分析計(MS)を使ったタンパク質の網羅的解析の進歩

も著しく、2014、2015 年度の当調査班の報告書でも多層的オミックス研究事例の紹介や

バイオマーカー研究について、報告してきた。今年度は、特に創薬への応用の一つとして、

オミックスデータのドラッグリポジショニングへの活用について調査を実施した。ヒアリ

ング調査にご協力いただいた東京医科歯科大学・東北メディカルメガバンクの田中博先生

によると、「ヒトの DNA をすべて解読すれば、その人のかかりやすい疾患が明らかになり、

健康を維持・ケアする方法ならびに適切な治療方針等が明らかになるのではないかとの期

待があったが、生命現象はそんなに簡単ではない。ゲノム(遺伝子)起源の疾患の数は予

想外に少なく、ヒトが病気になる過程は複雑で、治療方針を決めるとなると、ゲノムの情

報だけでは難しい」ことが明らかとなってきた。そういう意味で、ゲノム情報単独はもち

ろん、ゲノム情報以外のオミックスデータをゲノム情報と組み合わせて考えることも重要

である。

遺伝子の動きだけでも創薬に繋げることができることを証明されたのが産業技術総合研

究所の堀本勝久先生である。抗がん剤が効かなくなる前立腺がんに対し感受性細胞と耐性

細胞の遺伝子発現の違いについて、Broad Institute より提供されている遺伝子発現データ

ベースである Connectivity Map をベースに解析し、逆方向に動く薬剤があれば効くので

はないかとの仮説に基づき検証研究を重ね、リバビリンを発見した。現在、臨床試験で検

証が行われており、今後が期待されている。また、ゲノム情報と組み合わせて考えるべき

情報として遺伝子発現ネットワーク、パスウエイ解析、遺伝統計学、マイクロバイオーム

の解析など、多くの試みが行われている。オミックス情報等を用いて、ドラッグリポジシ

ョニングの研究を行っている九州大学・山西芳裕先生の場合、遺伝子発現データだけに拘

らず、タンパク質との相互作用である薬物応答プロファイル・疾患プロファイルにも注目

され、独自に統合的な手法を開発してドラッグリポジショニングの研究を展開されている。

Page 177: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第四章 考察

- 170 -

上述した研究は、アカデミアから発信される創薬として期待されるものの、一方で課題

もある。使用しているデータの多くは、海外のデータベースに依存しており、世界各国で

同じデータベースが利用され、また利用し尽くされていると言っても良い。すなわち、共

通な結果が導き出される可能性が大きく、スピードが要求される。そのため、独自性のあ

る解析方法の開発こそが重要となってくる。

別の課題としては、アカデミアの基礎研究から実用化研究への移行について、二つの課

題が医薬品業界に投げかけられている。一つは、ドラッグリポジショニングは古い薬が使

われることが多く、既に物質特許が切れているなど、医薬品としての権利化が難しいため

に製薬会社が前向きでないことである。二つ目は、precision medicine への発想の転換で

あり、この発想に従って疾患セグメントを絞れば、臨床試験の成功確率は高まり、小規模

の試験で済む一方で、従来型の製薬企業のビジネスとして取り組むには市場規模が小さく

なるという点である。しかし、アカデミア創薬の実現においては、ドラッグリポジショニ

ング研究を後期臨床研究にどう繋げていくかが重要であり、そのためには臨床研究へのバ

ックアップだけではなく、医薬品の再開発の在り方を国も含めて考える必要があるのでは

ないだろうか。

3.マイクロバイオーム研究の先制医療、創薬への応用

マイクロバイオーム研究では、細菌叢メタゲノムとメタボローム、宿主ゲノム、健康情

報、医療情報などが統合的に利用されており、ビッグデータを活用した病態研究とも捉え

られるため、当調査班でもマイクロバイオームを調査対象とした。

腸管内では、1,000 種類を超えるおよそ 100 兆個の細菌が様々な物質を生産し、宿主で

ある人に対して多大な影響を及ぼしていることが種々の研究で明らかになってきた。細菌

叢の機能を解明し、その機能制御法を見出すことが健康維持や慢性疾患の予防(未病治療)、

治療戦略に繋がると考えられ、大いに期待されている。National Microbiome Initiative

(米国)、Integrative Human Microbiome Project(米国)、Metagenopolis(欧州)の各

プロジェクトが立ち上がり、米国においては、2016年度と 2017年度の政府予算で$121M 、

民間からも$400M 以上が投じられるなど、マイクロバイオーム研究は盛り上がりを見せ

ている。ヒアリングにおいて、慶應義塾大学の福田先生には疾患との関連について現状の

解明状況を俯瞰的に伺ったが、先制・予防医療や創薬・治療に活用できるまでに、マイク

ロバイオーム研究において明らかにすべき点がまだまだ多いことが分かった。

例えば、現時点では、健常な細菌叢(ベースライン)を詳細に定義できていないため、

どのように細菌叢をコントロールすればよいのかについては分かっていない。また、ベー

スラインが個人によって多様で、その個体差が診断や治療への利用を更に難しくすると想

定される。まずは、ベースラインを捉えて、疾患の影響による細菌叢の変化を定量的ある

いは定性的に評価する方法の構築が必要である。

ベースラインを掴み、細菌叢の変化が疾患の原因なのか結果なのかを明らかにするには、

健常人コホート研究が有効である。宿主(健常人)のゲノム、生活習慣、食習慣、等の情

報に細菌叢のメタボロゲノミクスデータを加味した解析を前向きコホート研究により行

うことで、腸内環境の経時変化を捉え、適切に制御する方法を見出すことに繋がると期待

できる。日本においては東北メディカル・メガバンクをはじめとして、いくつかの良質な

Page 178: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第四章 考察

- 171 -

ゲノムコホート研究が実施されているため、それらで行われている採血、採尿に、採便を

追加するなどの仕組みを作ることで、新たなコホート研究を立ち上げることなく、現状の

コホート研究プラットフォームを生かしたマイクロバイオーム研究を進めることができ

ると考える。

こうしたコホート研究に組み入れられたマイクロバイオーム解析の成果の一つとして、

基礎研究、応用研究の基盤となる日本人の健常人腸内細菌叢データベースの整備も必須で

ある。腸内細菌の研究は欧米が先行しているが、腸内細菌叢の特徴として疾患による変動

以上に、地域差や人種差などが大きく、日本人の先制・予防医療に繋げていくためには、

日本人の腸内環境を知ることが必要である。また、同一健常人の腸内細菌叢情報を経時的

に取得しデータベース化することは、日本人の健常人参照データとして、将来的に、腸内

環境の改善や治療による患者の腸内細菌叢の変化を解釈する際に有用となる。

サンプル集積やデータ集積の仕組みだけでなく、その前段階として、サンプル収集やメ

タボロゲノミクスを効率的に実施するための更なる技術開発も求められている。現状、健

常人から試料である便の提供の協力を得ることは容易ではないため、便の簡便な採取法や

メタボロミクス用の試料保管を常温で行える試薬の開発は、サンプル収集への協力を幅広

く得るために重要である。また、日本人におけるベースラインを明らかにするためには、

5,000 例前後のサンプル収集は必要と考えられ、メタゲノム解析やメタボローム解析など

の実解析からデータ解析に至るまでの費用面での国のバックアップと解析拠点などを統括

した研究ネットワークの整備が必要である。さらに、異なる研究機関のデータを比較でき

るようにすることも重要で、そのためにはプロトコールの標準化が必要である。日本での

マイクロバイオーム研究の成果が国際的にも認められる環境づくりとして、まずは、日本

で標準プロトコールを作り、それを国際標準としていけるように、関係機関においては予

算配分などのサポートを期待したい。

また、欧米に伍していくという意味では、日本がノウハウを持ち、国際的な競争力があ

る研究基盤や技術を更に発展させ、マイクロバイオーム研究に投下することが重要となる。

東京工業大学の山田先生によれば、KEGG(Kyoto Encyclopedia of Genes and Genomes)

に含まれる代謝マップは長年に亘る経験と実績が積み重ねられており、世界的に活用され

ているとのことであった。腸内細菌叢の代謝マップも、優れたものが構築できるならば、

新しい制御因子が見つかり、その中には新たな創薬ターゲットとなるものも見つかる可能

性がある。日本が世界を先導できるマイクロバイオーム創薬を進めていくためにも、この

分野の研究の充実が最重要ポイントとなる。マイクロバイオームの代謝マップが整備され、

創薬ターゲットとなる分子やメカニズムの解析が進むことを期待したい。

マイクロバイオーム研究に対し、挑戦的研究課題に取り組んでいる研究者への科学研究

費の配分も必要である。ゲノミクス、プロテオミクスなどの研究分野に比較して、マイク

ロバイオームは挑戦的な研究分野となるが、それ故に新たな発想からの研究も必要になる。

ゲノムを中心とした網羅的オミクス研究では欧米に大きく水をあけられているのに対し、

未知の部分の多いマイクロバイオーム研究では、積極的な支援を行うことで、日本から世

界に先駆けた研究成果を創出し、その他のオミクス研究の成果と合わせて画期的な新薬を

生み出せる可能性がある。

一方、前述したような解析拠点などを包含した研究ネットワークの整備や膨大な解析費

Page 179: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第四章 考察

- 172 -

用などに対する予算的な研究のサポートだけでなく、マイクロバイオーム制御薬の臨床試

験のデザインや評価方法など、新たなレギュレーションのあり方に関する議論も規制当局

や製薬企業を中心に始めていく必要があると思われる。

将来、腸内細菌叢と疾患の関わりがより明確となり、疾患の有無がメタゲノムやメタボ

ローム解析から診断できるようになれば、健康診断の検査項目に腸内細菌検査が加わり、

腸内細菌がある種の臓器として認識されるような時代がやってくるかもしれない。そうな

る前に、腸内細菌叢を新しい臓器ととらえ、健康維持や疾患予防、治療に必須の研究対象

と考える必要がある。

4. AIの医療及び創薬への活用

(1)ビッグデータの解析への AI の必要性

現在、人工知能(AI)が、医療や創薬などの分野で注目されている。しかしながら、AI

そのものは決して新しい技術ではない。今、AI が再注目されているのは、深層学習による

機械学習の精度の向上と、学習させる情報、即ち“ビッグデータ”を収集できるようにな

ったことが、その要因であると考えられる。

医療分野のビッグデータは、医療情報などの電子カルテ(EMR:electronic medical

record)や個人の健康情報である PHR(personal health record)から、ゲノム情報やオ

ミックス情報などの生体ビッグデータまで様々である。一般に、医療ビッグデータを解析

するにはデータが構造化されている必要があるが、医師が電子カルテに入力するデータは、

診療時の問診・診察所見などの非構造化テキストデータ、一般検査やゲノム(オミックス)

解析などの特殊検査に基づく構造化されたデータ、画像や病理検査などの構造化しにくい

データ、服薬や手術などの治療及びその効果に関する所見など構造化データと非構造化デ

ータが混在する情報等、様々であるのが実状である。また、医師は、診療ガイドラインや

医学文献を参照して診療を行うが、それらもテキストデータであり、構造化されていない。

そこで、これらの構造化・非構造化データの夥しい集積からなるビッグデータを解析し、

それを近未来の医療に活用するためには、認知コンピューティングによる非構造化データ

の構造化や機械学習・深層学習の機能を搭載する人工知能(AI)の利用が欠かせない。今

回の調査においては、医療ビッグデータの解析における AI 活用の現状などについて、こ

の分野で先端的な研究開発を進めるアカデミア及び IT 企業の識者にヒアリング調査を実

施した。

(2)Watson の出現による医療革命

医療ビッグデータのAIによる解析は、米国IBMが実用化の先鞭をつけた。なお、IBMが

開発した、クラウドを通じて提供されるコグニティブ・コンピューティングシステムであ

るWatson(ヘルスケア向けにはWatson Health)の詳細については、第二章第4節に記載

した。

Watson for Genomics及びWatson for Oncologyは、医療支援AIシステムである。前者

のWatson for Genomicsについて、IBMでは米国の17のがん専門病院と共同研究を進めて

いる。また、米国の民間の検査センター、Quest Diagnosticsはがん細胞のゲノム変異につ

いてWatson for Genomicsによるアノテーション付与を開始し、全米の病院に対して有料

Page 180: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第四章 考察

- 173 -

サービスを展開すると発表している。国内では東大医科学研究所が臨床研究に使用してお

り、がん細胞のゲノム変異から特殊な血液がんが診断され、更には提示された標的薬の処

方により寛解に導かれた事例がマスメディアにも大きく取りあげられ注目を集めた。後者

のWatson for Oncologyは、がんの診断支援を行なう。患者の電子カルテに記載されたデ

ータ(乳がんの場合には、25〜30のデータ)を入力すると、National Comprehensive Cancer

Network (NCCN)のガイドライン及びMemorial Sloan Kettering Cancer Centerの標

準治療に照らして、その患者に推奨される治療法及びその根拠が出力される。

米国においては、Watsonが既に実臨床に使用されようとしている。2016年末に米国下

院は、”21st Century Cure Act”という法律を承認し、オバマ大統領はそれに署名した。こ

れにより、米国では、診断支援AIシステムは、ペースメーカーのような医療機器と区分さ

れ、規制の対象外となった。このような状況の下、米国においては診断支援としてAIの普

及が加速するものと予想される。

(3)医療用AIの開発に向けた国内企業の取組み

AI の医療への活用について、IBM 以外の国内の動向としては、Preferred Networks や

FRONTEO が挙げられる。Preferred Networks は、国立がん研究センターを中心として

がん患者の臨床情報、オミックス解析を含むビッグデータ、更に文献情報を統合して、機

械学習・深層学習により最適な治療法を選択する医療システムの開発を目指している。ま

た、FRONTEO は同社が開発した AI である「KIBIT」を用い、がん研究会と協力して同

様なシステムを開発すると思われる。近い将来、国内で開発された学習済みモデルを組み

込んだ診断ソフトウエアが商用流通され、がんの診断・治療に使用されることを期待した

い。

(4)AI で解析する情報の質向上に対する取組み

一方、このような医療向け AI についての課題もある。その一つが、用いる情報に記述

されている医学用語の類義語や同義語の統一である。米国においては、医学用語の統一的

データベースとして、国立医学図書館(National Library of Medicine: NLM)が統合的医

学用語システム(Unified Medical Language System: UMLS)の整備を進めている。国

内においては、医学中央雑誌刊行会(NPO 法人)や東京大学の臨床医学連結知識データベ

ース(Linked Clinical Knowledge Database: LiLak)が一部実用化されているものの、医

学用語の類義語や同義語(シソーラス)辞書の整備状況は充分とは言いがたい。ビッグデ

ータの AI 解析に先立ち、良質な電子カルテ情報が集積されなければならないが、そのた

めには、医学用語の日本語環境の整備が求められる。

また、AI の医療への応用についての別の課題として、学習させる情報の質が挙げられる。

前述した FRONTEO とがん研究会の協働では、特に、論文情報を精査し、質の高い学習

情報を用いると強調している。IBM の Watson も同様であるが、如何に質の高い情報を学

習させるかが、AI からの解答の精度において最も重要と言われている。しかしながら、今

後、膨大な量の論文などのテキスト情報をどのように精査していくのか、大きな課題であ

る。論文をランク付けし、上位の論文のみを使用するなどの方策が考えられるが、網羅性

は損なわれる。また、論文の選択を各疾患領域でどういう判断基準で行うのか、言い換え

Page 181: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第四章 考察

- 174 -

れば AI の学習に携わる医学研究者のバイアスも考慮する必要がある。

AIについてのもう一つの課題として、機械学習・深層学習を用いる医療プログラムの知

的財産の確保がある。開発された技術・製品の独占性を確保する上で重要である。特許権、

著作権及び不正競争防止法による保護の対象になると思われる。一方で、患者データにつ

いては、個人情報の保護という使用制限があることを忘れてはならない。

(5)AI研究成果の知財保護

機械学習・深層学習では学習のステップが最も重要である。順番に質の高い生データの

収集(患者背景データやオミックスデータなど)、生データに対する注釈付け、独自アル

ゴリズムによる学習、検証として別の学習用データによる強化学習、を順番に行い、学習

済みモデルが完成する。したがって、医療応用を考える時には、このような”学習済み”モ

デルが最も重要であり、知財として保護されるべきものと思われる。しかし、日本の特許

庁は、実際の審査過程と基準を公表していないために、産業界には不安があると聞く。更

に、国内においては、学習済みモデルは先に述べた医療機器プログラムとして原則的には

薬機法の規制対象となる。今までのところ、医療用AIソフトで既に販売されているもの、

または申請段階にあるものも無いようであるが、今後の規制基準面での扱いについて不透

明感を感じる。

(6)創薬へのAIの活用

AI の創薬研究への応用例では、創薬支援の AI システムである IBM の Watson for Drug

Discovery が先行している。ベイラー医科大学の研究グループは、システムを用いて p53

に関する約 7 万の論文から、コンピュータによる言語処理により p53 を活性化するリン酸

化酵素を新たに 7 つ発見した。論文というテキストデータを読み込み、その中で使用され

た単語の出現頻度や相互の関係性を解析し、それらから生化学的な関係性、つまりタンパ

ク質間の相互作用や遺伝子とタンパク質間の関係性を推定し、創薬標的分子を選定した。

従来、人間は自身が確認できる範囲でのみ創薬標的分子探索を行ってきたが、Watson に

代表される AI を用いて、知識空間全体を網羅したビッグデータ解析によって新たな創薬

ターゲットが発見されることを期待したい。

国内に目を向けると、医薬基盤・健康・栄養研究所は、平成 29 年度からの 5 カ年計画

で、AI 創薬を指向したコンピュータシステムの構築をめざしている。最終年度の平成 33

年度には、AI システムによる創薬標的分子の提案及び実験的検証が目標に掲げられている。

初年度の AMED からの研究予算は約 2 億円と控えめである。一方、文科省でも、異業種

連携コンソーシアムによる AI 創薬に関するプロジェクトを進めようとしている。武田薬

品、富士フィルムなどの医薬品企業と NEC、富士通などの IT 企業の約 50 社の企業連合

に、理化学研究所や京都大学が加わり、独自の創薬用 AI 開発とそれを利用した創薬プロ

ジェクトを開始している。

(7)課題

今後、医療ビッグデータを AI により解析し、その結果を創薬研究に使用する機会は確

実に増加すると予想される。患者の臨床背景情報や健診情報、更にオミックス解析結果は、

Page 182: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第四章 考察

- 175 -

改正個人情報保護法に定義された個人識別符号、または、要配慮個人情報が含まれる。個

人情報の保護の重要性は、社会的にもますます高まっており、これら情報の取得・利用・

管理と言うソフト面での厳格な対処が求められる。それに加えて、万が一にも情報の漏洩

やハッキングを許さない、ハード面でのサイバーセキュリティ対策が必要である。

AI に関する研究開発について中央省庁の取組みを見ると、総務省、文科省及び経産省が

それぞれに担当分野を決めて推進している。保健医療分野については、厚労省が”AI 活用

推進懇談会”を主催し、その中で創薬研究について議論されると言われている。関係 4 省庁

がより連携・協力を深めて、限りある研究費の”二重”配分はくれぐれもないように望みた

い。

他方、国内においては、東北メディカル・メガバンクのコホート・オミックス研究のよ

うによく整備されたビックデータが存在する。AI は、表面的な類似性の見られる数千程度

のクラス分類からなる静的データの処理解析は得意とする。コホート・オミックス研究の

データが、AI 創薬に有効に利用されることを期待したい。

AI が創薬に、特に患者ベースでの創薬標的探索などに貢献できることを期待したいとこ

ろである一方、課題もある。今後、膨大な情報の精査をどのようにしていくのか、また、

がんの変異のような静的なものではなく、もっと動的変化のあるオミックス情報をどう精

度よく AI の学習に活かしていくのか、更には現在の AI でそのような複雑な変化に基づく

解析が可能なのか、など多くの課題は残っている。AI が単なるブームにならないようにす

るためにも、このような課題を国家レベルで克服すべきである。

Page 183: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第五章 提言

- 176 -

第五章 提言

今年度の調査対象である医療ビッグデータ及び ICT・AI の活用状況等についての調査結

果を元に、ヒューマンサイエンス振興財団創薬資源調査班では議論を重ねた結果、今後、

我が国の製薬企業をはじめとする医療関連産業、関連する行政当局、及びアカデミアが克

服すべき課題と進むべき道に関し、以下を提言する。

1) データの質を確保するために

提言1 医療ビッグデータの利活用促進のため、アカデミアは医療情報の精査と基盤技術の

構築を、行政はアカデミアが作成した標準化案や統一案の臨床や研究の現場への

普及を諮るため以下の施策の推進を

・ 医療情報の標準化に向けた取組みの加速

・ 医学用語の日本語での類義語や同義語の統一化

・ 自然言語処理技術向上の推進

・ 文献情報の精査の推進

<背景>

医療情報の収集・管理などの基盤整備は進み始めており、利活用のシステム構築やルー

ル作りについても取組みが始まっている。しかし、“利活用”していくには、システム整備

だけでなく、データの精査ならびに解析に対応するための加工が必要である。特に、課題

として、文献情報の質的精査、医療情報データやオミックスデータ等における欠損値など

が、AI で解析する際の大きな課題であることが分かった。また、カルテ等に記述されてい

る医学用語の類義語や同義語の国内での不統一も、自然言語処理での作業に支障をきたす。

これらの課題改善に早急に取り組むことが、ビッグデータ活用推進、AI の活用にあたり、

極めて重要なことと考える。「保健医療分野における ICT 活用推進懇談会」で提案された

ように「患者・国民にとっての価値」のあるデータを「つくる」ことが重要である。

Page 184: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第五章 提言

- 177 -

2) オミックスデータの ドラッグリポジショニング(DR)等への更なる活用を目指して

提言 2 行政および産業界は、アカデミア創薬で適応症以外の別疾患での有効性が有望視さ

れる上市薬(DR 薬)が迅速に再開発できる仕組みの構築を

DR 薬の適正な薬価算定の仕組みの構築

DR 薬のための承認審査制度の構築

製薬企業による希少疾患などでの DR 薬研究開発への取組み

<背景>

オミックス情報を活用したドラッグリポジショニングへの取組みは、アカデミア創薬の

研究成果である。また、ドラッグリポジショニングは、市場で既に安全性が確認されてい

る場合など、開発コストを軽減できる可能性もある。しかし、未だ新薬を開発するメーカ

ーとアカデミア間で隔たりがある。アカデミア創薬を推進するためには、早期に臨床研究

に移行するための体制の整備も必要であるが、ドラッグリポジショニングに関しては、古

い薬の開発に対する何らかのインセンティブ(適正な薬価算定の仕組み、審査制度の緩和

など)の検討など、新薬メーカーが上市薬を有効的に再開発できる仕組み作りが必要と考

える。

3) マイクロバイオーム研究成果の活用のために

提言 3 アカデミアと産業界は、協力して以下の研究基盤の整備と技術開発に早急な対応を

暫定的な試験方法標準化の早急な整備

日本人標準データの整備、現在進行中のゲノムコホート研究との協働

研究基盤ネットワークの構築

代謝マップ構築など研究基盤整備の推進

<背景>

多くの疾患で、腸内細菌との関連性が報告され、マイクロバイオームは未病治療または

予防医療の分野で注目されている。しかし、細菌叢のバランスは、患者と健常者の差より

も、地域差や人種差などが大きく、日本人の先制・予防医療に繋げていくためには、日本

人の腸内環境を知ること(日本人標準データ)が必要であることと、そのための研究とし

て試験方法の標準化が必要である。

日本人の標準データの整備に関しては、現在、国内で進行中のゲノムコホート研究の中

でマイクロバイオーム関連のデータを取得して行くことも有効と考えられる。

測定技術が進化し、測定項目が個々の研究で異なる中で、試験方法の恒久的な標準化は

Page 185: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

第五章 提言

- 178 -

難しい。また、日本人標準データ作製においても、膨大な人数の被験者が必要となり、今

後、メタゲノムシークエンシングなどの研究費用の確保が必要となるが、個々の研究機関

が独立して、進めていくのでは、研究スピードも費用面も非効率である。暫定的な測定方

法の標準化とともに複数の解析センターを設け、研究ネットワークを構築し進めていくこ

とが望ましい。

一方、我が国が基盤技術を持つ、細菌叢の代謝マップを更に充実させることにより、新

たな創薬標的分子や診断マーカーの発見に繋げることも考慮すべきである。

4) 医療・創薬への ICT・AIの利活用に向けて

提言 4 行政、アカデミア、産業界は互いに協力して、次世代 AIの技術開発に向けた研究体

制の構築を

・ ICT 研究者と生命科学者の協働プログラムの拡充

- AI が解析結果を産み出す過程の透明化

- 更なる機械学習法の開発

・ AI と生命科学をともに学べる教育プログラムの構築

- 知財、倫理、セキュリティなどの専門家の育成

<背景>

AI は、学習させる情報がベースであり、基本的には回答も学習した情報の範囲からしか

生み出されない。言い換えれば、学習した情報から大きく外れたものは除外されていく。

しかし、生命現象は複雑であり、学習した情報から外れた情報に、誰もが気付かなかった

新たな創薬シーズが潜んでいる可能性がある。より複雑な事象からの回答を AI に求める

なら、より高性能な AI 技術が必要になる。そのためには、モデルデータでの検証試験な

どで、単なる数値の変動に関する技術的な議論だけを行うのではなく、ICT 研究者と生命

科学者の双方の分野の理解、融合が必要である。

深層学習及び画像処理能力の向上ならびに情報量の増加により、AI 技術が急速に進歩し

た。学習させる情報の質に関しては、前述したようなデータの精査などが必要だが、もう

一つの大きな課題が AI の解析過程がブラックボックスである点である。AI は、可能性に

ついて助言するものであって、正しい答えを出すとは限らない。したがって、AI がどのよ

うな過程を経て回答を導き出したかが、その回答を参考にして判断する側にとって AI 活

用の大きな判断材料となる。また、AI を開発する側にとっても、さらに高性能な次世代

AI へ繋げていくための情報となる。

Page 186: $ª (5 > E Å µ ¢ ¹ î ± j g ICT íAI b < q#Ý b qii 本調査にご協力いただいた学識経験者及び機関 >& W&à$ d µ6õ50 8b8p d c Ä Ü å ¢ ì!l>'

○C 2017 公益財団法人 ヒューマンサイエンス振興財団

報告書の著作権は発行元に、図表の著作権は提供者にあります。

発行元の許可なくして転載・複製を禁じます

平成 28 年度

創薬資源調査報告書

医療分野におけるビッグデータ並びに

ICT・AI の利活⽤の最新動向

-創薬並びに個別化医療・先制医療への貢献の道を探る-

発行日: 平成 29 年 3 月 29 日

発 行: 公益財団法人 ヒューマンサイエンス振興財団

〒101-0032

東京都千代田区岩本町 2-11-1 ハーブ神田ビル

電話 03(5823)0361/FAX 03(5823)0363

(財団事務局担当 加藤 正夫)

印 刷: タナカ印刷株式会社

〒105-0023

東京都江東区平野 2-2-39