п»ї 個体差の機械学習 『みんなで機械学習』第11回 | ニュース屋台村

個体差の機械学習
『みんなで機械学習』第11回

10月 19日 2022年 社会

LINEで送る
Pocket

山口行治(やまぐち・ゆきはる)

o株式会社ふぇの代表取締役。独自に考案した機械学習法、フェノラーニングのビジネス応用を模索している。元ファイザージャパン・臨床開発部門バイオメトリクス部長、Pfizer Global R&D, Clinical Technologies, Director。ダイセル化学工業株式会社、呉羽化学工業株式会社の研究開発部門で勤務。ロンドン大学St.George’s Hospital Medical SchoolでPh.D取得(薬理学)。東京大学教養学部基礎科学科卒業。中学時代から西洋哲学と現代美術にはまり、テニス部の活動を楽しんだ。冒険的なエッジを好むけれども、居心地の良いニッチの発見もそれなりに得意とする。趣味は農作業。日本科学技術ジャーナリスト会議会員。

今後の世界経済はリセッション(景気後退局面)となることが確実視されている。筆者が製薬企業の臨床開発部門に所属していた20年前、新薬開発、特に認知症や脳卒中などの、加齢とともに発症リスクが高まる脳疾患の治療薬開発が行き詰まっていた。筆者たちのグループは、薬効評価を質問票の点数(スコア)で行っていることに問題があると考えて、医療画像などの「測定」できる数値(バイオマーカー)による薬効評価に取り組んでいた。FDA(米国食品医薬品局)は製薬企業の活動と呼応して、白書”Innovation or Stagnation”(※参考1)を公表している。残念ながら、その後の新薬開発では、イノベーションではなくスタグネーション(停滞)の予想が的中してしまった。例外は、ガン治療薬などにおけるバイオ医薬品で、とても高価だけれども有効な新薬が、次々に開発されている。最近、エーザイは認知症の重症化予防効果があるバイオ医薬品(抗体医薬)の開発に成功した。バイオ医薬品の開発において、当時開発していたイメージング・バイオマーカー(FDG・PETやアミロイドPET)が活用されているので、全面的なスタグネーションではないとしても、新薬開発におけるバイオマーカーの活用は、期待には応えられなかったといわざるを得ない。新薬開発だけではなく、経済全体においても、金融やITのイノベーションは社会・経済の期待には応えられず、リセッションとなってしまうのだろうか。

「No Music, No Life」には違和感がないとしても、「No Innovation, No Life」は疑問が残る。しかし残念ながら、近代以降の産業社会は「No Innovation, No Life」であり、イノベーションが社会秩序や地球環境を破壊し続けている。自戒を込めて、「With Innovation, No Life」かもしれない。「No Music, No Life」の場合、どこかに自分が好きな音楽があるという安心感がある。最近のAI(人工知能)技術は、各人の好みの音楽を的確に把握して、音楽以外でも売り込みのチャンスをうかがっている。産業社会のイノベーションの場合は、覇権国家や大企業のビジネスが優先され、個人には不安感だけが残る。大量破壊兵器のイノベーションにおいて、水爆でも十分以上だと思われるのに、ロシアは「ポセイドン」という原子力魚雷を開発しているというから(https://news.yahoo.co.jp/articles/ロシアの“終末兵器”ポセイドンとは)、国家が開発するイノベーションに不安にならない人はいないだろう。

バイオマーカーという新薬開発のイノベーションにおいて、ビジネスとしての問題点は、だれがどのようにしてバイオマーカー開発のコストを負担するのかということだった。最初はグローバル製薬企業が負担し、それでも支えきれなくなったら、国家が研究予算を負担した。しかし、患者個人が負担するような、経済的に持続可能なバイオマーカー・ビジネスの出口戦略は見つからなかった。製薬企業や患者にとって、医薬品の開発コストは理解しやすいけれども、新薬を開発する「方法」でしかないバイオマーカーは、「診断」以外の目的では、経済合理性を見いだしにくい。『みんなで機械学習』第10回を再開したのは、長い間探し求めていたバイオマーカー・ビジネスの出口戦略を見いだした、と思われたからだ。それは、「No Music, No Life」のような、「個体差の機械学習」であって、患者自身が安心感を持って受け入れられるような、理解しやすいイノベーションでもある。秋空のイワシ雲は、これから書き続けようとしている「スモール・ランダムパターンズ・アー・ビューティフル」の基調になっている。巨大な台風雲よりも、イワシ雲のほうが安心感があるはずだ。

筆者撮影、2022年10月3日

「スモール・ランダムパターンズ・アー・ビューティフル」

1 はじめに; 千個の難題と、千・千・千・千(ビリオン)個の可能性

わたしたちは、楽観的な未来が見いだせない時代に生きている。だからこそ次世代のために、近未来の「データの時代」を、楽天的に素描してゆこうと思う。「データの時代」の技術的な内容や社会への影響について、専門家や有識者による多数の出版物がある。わたしたちのような在野の実務家にとって、「データの時代」に付け加えることなどあるとしたら、生き延びてゆくための楽観性だ。楽観的ではあっても、わたしたちは「データの時代」に最大限の希望とともに、その希望がかなわないかもしれない危惧も感じている。、ドイツ生まれのイギリスの経済学者エルンスト・シューマッハ(1911-1977)の『スモール・イズ・ビューティフル』は、巨大化する産業社会と産業技術に関する、経済学者からの警鐘だった。世界中の多くに人びとに、シューマッハからの明確なメッセージが伝わったけれども、残念ながらグローバル経済は加速・巨大化し続けている。近未来のあるとき、なぜ『スモール・イズ・ビューティフル』なのかという小学生からの質問に、「イワシ雲のような、小さいけれども微妙にランダムなパターンがたくさんあるとビューティフルですね」という解答が与えられたと仮定しよう。もちろんシューマッハ先生の死後の話で、「データの時代」への入り口だった。個々の問題には、たくさんの回答があり得るだろう。わたしたちが生きている時代には、ありとあらゆる社会的課題が未解決で、山積みにされている。近未来の「データの時代」において、『スモール・イズ・ビューティフル』はAIアルゴリズムとして、コンピューターが実行可能となることを夢見よう。その時には千個の難題に、コンピューターが千・千・千・千(ビリオン)個の解決可能性をシミュレーションするようになるだろう。本当の問題解決は、「スモール・ランダムパターンズ・アー・ビューティフル」と感じる、わたしたちが達成しなければならないとしても。

1.1個体差すなわち個体内変動と個体間変動が交絡した状態-時代は感受性に運命をもたらす

円熟する、自分の歳月をガラスのようにくだいて、

わずかずつ円熟のへりを噛み切ってゆく。

死と冒険がまじりあって噴きこぼれるとき

かたくなな出発と帰還のちいさな天秤はしずまる。

『詩集<太平洋>』(新鮮で苦しみおおい日々、堀川正美、思潮社、現代詩文庫、1970年)

わたしたちが生活しているこの時代は、不確実性が増大している。かつて確実だと思われたことが、ことごとく不確実であることが明らかとなり、不確実な出来事の影響が増大している。『「不確実性」超入門』(田渕直也、日経ビジネス人文庫、2021年)は、ビジネスの視点から不確実性が増大している時代を俯瞰(ふかん)している。多少、量子力学や複雑系の理論に言及しているけれども、「確率」の主観性や客観性については、ビジネスにとって意味のある無難な範囲での議論をうまくまとめている。

ナシーム・ニコラス・タレブは、『「反脆弱性」不確実な世界を生き延びる唯一の考え方』(ダイヤモンド社、2017年)において、不確実な予測にもとづいた頑健なシステムに依存するよりも、現状が脆弱(ぜいじゃく)であることを認識して、ランダムな変動と共に生きること(反脆弱性)を推奨している。わたしたち日本人にとっては、津波への対処は、頑健な堤防を造るよりも、日ごろの訓練のほうが効果的だ、というと分かりやすいだろう。原子力発電所の反脆弱性を考えると、非常用電源を、安全な場所に確保することが大切であることに気がつく。タレブの議論は、金融業界のトレーダーとしての実務経験を、哲学的に反省したもので、「データの時代」を先取りしている。タレブの文章は刺激的で辛辣(しんらつ)ではあっても、スコラ哲学を好意的に評価して、過度に反体制的な哲学を批判するなど、タレブの社会的な立ち位置は、中庸から保守に近い。

病気や生死などの、明らかに個体差がある場合の「確率」は、個体差にともなう不確実性が避けられない。不確実性に関連する「個体差」とは何なのだろうか。統計学では、個体差を個体間変動と個体内変動に区別して、単純な個体間変動もしくは個体内変動だけでは説明しきれない個体差を、個体内変動と個体間変動が交絡した状態と考える。何のことを言っているのか意味不明だろう。個体差に起因する不確実性が、個体内変動の無い個体間変動のような(例えば遺伝子の変異)、単純な統計モデルで扱える場合は、統計的手法によって確実な(個体差が無い真の値に近い)推論や推定ができるけれども、複雑に個体内変動と個体間変動が交絡した状態では、通常の統計的手法があまり役立たないという意味だ。病気や生死などの不確実性にとって、母集団における「真の」推計値ではなく、自分自身に関する判断が最重要である場合は、自分自身の状態が日々変化するので、複雑に個体内変動と個体間変動が交絡した状態といわざるを得ない。すなわち、健康やビジネスにおいて、自分自身の問題を考えるときには、個体差にともなう「不確実性」の理解は、単純な統計的手法はあまり役立たない。

病気や生死などの医療統計において、「個体差」は変量効果モデルとして理解される。変量効果モデルとは、統計モデルにおける誤差項が測定誤差だけではなく、統計モデルのパラメーターにも個体差にともなう誤差項が含まれるモデルだ。実際は、固定効果モデルと変量効果モデルを組み合わせた、混合モデルによる統計解析が行われる。例えば、心臓発作の発生率に体重が影響していると仮定しよう。人それぞれ年齢や性別、遺伝的にも理想体重が異なるはずなので、理想体重からのずれが問題だと考えると、理想体重は測定できず推定するだけなので、個体差を考慮した変量効果モデルの考え方が必要になる。この場合も、単純な統計モデルで個体差を考慮したとしても、あくまで母集団における「真の」推計値の問題でしかないことに注意しよう。

通常、変量効果モデルでは、個体は一つの母集団に属していると仮定するのだけれども、裕福な生活と貧乏人で格差が社会的に固定化されている場合、母集団そのものが異なると考えても不思議ではない。不確実性に関連する「個体差」は、個体集団の構造(社会)がデータに潜在的に影響を与えるため、統計モデルの記述では不十分で、臨床試験における無作為化のような、実験的な介入が必要になる。無作為化(ランダム化)によって、個体集団の構造に起因する潜在的な因子を平均化する場合、特定の効果に関連したグループごとに相当数の例数が必要となり、「個体差」を実用的なレベルで理解するためには、大規模試験とならざるを得ない。それでも、母集団における推計がある程度正確になるだけで、各人の個体差を正確に評価しているわけではないことに変わりはない。

最近は、インターネット技術の進歩によって、膨大な量のデータを安価に収集することができるようになった。健康やビジネスの分野においても、ビッグデータの利用が模索され、例えば販売履歴などから、「個体差」が実用的なレベルで理解できるようになっている。驚くべきことに、この場合の「個体差」は、本当に各人の個体差を評価している。その決定的な違いは、統計モデルではなく、AI技術における機械学習の方法が用いられていることにある。しかし、現在の最も進化した機械学習法であるディープラーニングでは、統計モデルとは異なって、個体内変動と個体間変動の交絡をどのように判断するのか説明できない。正解の確率が高まるように、膨大な数のパラメーターを、プログラムが自動的にチューニングするだけだ。自動運転する自動車が事故を起こした場合に、どのように対処するのか、ある程度の社会的なコンセンサスが確立してからでないと、ディープラーニングを医学に応用することには制約が多い。医薬品のインターネット販売において、AI技術が医薬品をリコメンドしても、わたしたちは安心して受け入れることができない。

「データの時代」とは、ビッグデータの時代なのだろうか。「微妙にランダムなパターン」であっても、大空全体や巨木のようにビッグピクチャーを描くことができる。エルンスト・シューマッハの『スモール・イズ・ビューティフル』では、巨大技術や先端技術の危険性を先見し、自足生活のための中間技術を推進することが主張されていた。わたしたちの物語では、個体差に関連した「データ」による機械学習が、地球レベルでの自足生活のための中間技術を実現すると仮定している。個性豊かな、たくさんのスモールデータを活用することによって、「スモール・イズ・ビューティフル」な近未来の「データの時代」となることを夢見ている。しかし、とても危険なビッグデータや先端技術もあり得るので、台風雲のような危険な未来も想定して、当面の生存を確保することの大切さも忘れないようにしたい。

※参考1:山口行治、新薬開発におけるバイオマーカー活用の現状、日薬理誌(Folia Pharmacol. Jpn.)131.435-440 (2008)

--------------------------------------

『みんなで機械学習』は中小企業のビジネスに役立つデータ解析を、オープンソースの無料ソフトOrangeでみんなと学習します。技術的な内容は、「ニュース屋台村」にはコメントしないでください。「株式会社ふぇの」で、Orangeにフェノラーニングを実装する試みを開始しました(yukiharu.yamaguchi$$$phenolearning.com)。

コメント

コメントを残す