п»ї 認知症を生きる人類と人工知能(2) 『住まいのデータを回す』第15回 | ニュース屋台村

認知症を生きる人類と人工知能(2)
『住まいのデータを回す』第15回

11月 13日 2018年 社会

LINEで送る
Pocket

山口行治(やまぐち・ゆきはる)

株式会社エルデータサイエンス代表取締役。元ファイザーグローバルR&Dシニアディレクター。ダイセル化学工業株式会社、呉羽化学工業株式会社の研究開発部門で勤務。ロンドン大学St.George’s Hospital Medical SchoolでPh.D取得(薬理学)。東京大学教養学部基礎科学科卒業。中学時代から西洋哲学と現代美術にはまり、テニス部の活動を楽しんだ。冒険的なエッジを好むけれども、居心地の良いニッチの発見もそれなりに得意とする。趣味は農作業。日本科学技術ジャーナリスト会議会員。

前稿「認知症を生きる人類と人工知能(1)」では、意思決定よりも未来予測のほうが重要と結論した。意思決定は統計学の仮説検定理論や経済学に応用されるゲーム理論の課題で、限られたデータから合理的な意思決定を行う数理理論がほぼ完成している。しかし、間違った未来予測にもとづいて問題が設定された場合、その正解は実際の未来には役立たない。

現在の医学では、正確な診断と有効性の統計学的評価が重要視されるけれども、生存中には診断がほぼ不可能な病気も含めて、臨床診断の正確さは多くを期待できない。複数の病気が同時に発症している場合も少なくない。有効な治療が選択された場合でも、複数の選択肢における最適な選択である保証はなく、多種類の治療が同時に行われることも多い。治療法を組み合わせた場合の有効性や安全性の評価、および経済性の評価は困難だ。このように、数理的な意思決定理論は様々な制約条件や限界がある。患者の立場からは「予後予測」が最も重要であるにもかかわらず、個別の患者の予後予測のために役立つデータはほとんど取得されず、予後予測は統計的な意味での疫学研究の結果を個別の患者に当てはめるか、臨床医の直感と経験に依存する場合がほとんどだ。間違った予後予測にもとづいた治療法の選択が合理的であるはずがない。

人工知能(AI)時代には、処理しきれないほどのデータが容易に入手できる。この人類にとっては過剰なデータから、AIプログラムによって正確な未来予測を行い、人類が直感的に理解しやすい情報表現を工夫して、集団的なコンセンサスの形成による意思決定を行いたい。近代的な合理性を根本的に再考することで、新しい数理理論の可能性が見えてくる。

◆未来の未来予測

天気予報や経済動向など、様々な科学的な未来予測が行われている。しかし、現在の状態を過去どのように予測したのかという事実を示してから、未来予測を行っている事例はほとんどない。例えば台風の進路を、過去はどのように予測したのかという事実は示されず、未来の進路だけが図示される。選挙予測の場合は、予測が投票率や得票数に影響を与えるので、なおさら過去の予測が重要になる。近未来には、例えば来週のサンマの値段とともに今日の値段が表示されるように、様々な身近な物事が未来予測されるようになると思われるので、未来予測の品質管理と責任について、法制度を整備する必要がある。

サンマの値段が安い店は品質が悪いかもしれない。サンマの値段の未来予測が正確な店は、不正確な店よりも合理的な経営ができるだろうから、品質と価格のバランスが良いと思われる。もちろん未来予測を行うことは義務化できない。しかし未来予測を行う場合は、日銀も医師も、経済的な影響に応じて、相応の法的な責任を取ってもらいたい。台風の進路予測では、予測円は70%の予測精度でしかない。90%、95%の予測精度の円も表示してもらいたいものだ。50%では丁半博打(ばくち)だから、70%も相当疑わしい。がんの手術を患者さんに説明するときに、5年生存率が50%だといえば相当深刻に聞こえるけれども、その予測値の95%信頼区間を説明できる医師はほとんどいない。少なくとも性別、年齢、がんのステージと治療法で調整した患者個人の予後予測は現在でも可能であり、遺伝子情報で調整することも難しくはない。医師にとっては、予後予測の正確さではなく、手術の効果と安全性にしか興味がないのだから、予後予測は統計理論を理解できる専門家、AIプログラムの仕事となるだろう。AIプログラムの責任は、AIプログラムを作成したプログラマーや、AIプログラムを販売する業者が関与することは確実であっても、これらの直接に関与するひとびとの責任はあまり重要ではない。AIプログラムを作成するAIプログラムや、AIプログラムが使うデータの責任のほうが重要で、現在の法制度の枠組みを大きく変えない限り、対応は困難だろう。法律もAIプログラムとなって、判断を迅速化し、合理的なバランスを動的にとってゆくしかなさそうだ。

◆視覚は線形世界なのか

AI技術について論じているのに、具体的なコンピュータープログラムについては記載してこなかった。AI技術の技術思想について深掘りしているつもりで、例えば特許は技術思想であり、特許の明細書に書かれるような具体例は時間とともに塗り替えられてゆく。AI技術は新しい時代の技術であるため、特許によって公開されることは稀(まれ)で、オープンソースプログラムとして公開されている。AI技術のリーダーであるグーグルが推進している

TensorFlow(※参考1)はAI技術のオープンソースプログラムであり、ディープラーニングを実装している。コンピュータープログラムについてご存知の方は、かつての多層パーセプトロンを何十層にもディープなものとしたプログラムで、誤差逆伝播法(バックプロパゲーション)による学習を行うと言えば、なんとなく分かっていただけると思うけれども、何のことだかさっぱりという方も多いだろう。TensorFlowのプログラマーであっても、数学的な意味でのテンソル(Tensor)が、高校で学習するベクトル(1階のテンソル)や行列(2階のテンソル)をさらに一般化した線形作用素であるということを理解しているプログラマーは少ない。実用的な意味で何故テンソルなのかというと、白黒の画像だけではなく、カラー画像も簡単に取り扱えるようになる。TensorFlowは視覚の認知モデルを一般化したAIプログラムといえるだろう。

線形作用素は量子力学に不可欠なものであり、量子力学の初期に行列力学が完成したときから数学者がその精密化に取り組んできた。ニュートン力学で微積分学の精密化を必要としたような事情だ。テンソル解析はアインシュタインも得意としてきたし、一般相対性理論は重力場のテンソル解析であり、古典的な線形幾何学でイメージができる。量子力学ではディラック(英理論物理学者)などが相対論的量子論の議論を進めて、スピノールというテンソルをさらに一般化した数学的対象を発見した。スピノールは半整数(1/2)の階数を持ち、2回転しないと元に戻らないメビウスの輪のような幾何学となる。スピノールの幾何学を学習することが、本稿の出発点でもあった。SpinorFlowのようなAIプログラムができたら、コンピューターは量子力学を理解できるようになるのだろうか。この話題自体は冗談なのだが、現在のTensorFlowでは3次元物体の回転運動をうまく取り扱えない。複素数で2次元物体の回転を表現できるように、4元数であれば3次元物体の回転を表現できる。4元数のほうがスピノールよりもイメージしやすく、ロボットの運動を記述するプログラムで使われている。コマの自転や高次元の回転を取り扱うのにはスピノールを使うしかなさそうで、SpinoeFlowができれば、強力なAI技術となるだろう。視覚の認知モデルを運動の認知モデルとの連関づけることで、動物の脳のレベルに一歩近づく。

◆聴覚と記憶

聴覚の認知モデルをAI技術とすることを考えてみよう。聴覚が時間的に変化する周波数に依存することは、音楽の楽譜のような認知モデルであることを示唆している。実際、蝸牛(かぎゅう、※参考2)の巻貝のような構造において、音の入り口側では高音域を、蝸牛の内側では低音域に反応していることが分かっている。しかし、聴覚は機械的で受動的な感覚器官ではなく、脳からの刺激や音の大きさに応じて、非線形な増幅特性を持っている。音声のような意味のある音を聞き分け、自発的に音を発生しながら聞いているなど、能動的な感覚器官であることが明らかになってきた。いずれにしても、視覚の認知モデルと聴覚の認知モデルでは大きく異なるので、聴覚の場合TensorFlowを使う前にデータの前処理が必要になる。

例えば音楽なら楽譜にして、会話なら文字にしてからTensorFlowを使うことになる。しかし機械音による故障診断のように、経験的には分かっていても記号化が困難な場合は、フーリエ変換などして、時間周波数解析(※参考3)を行うことになる。短時間フーリエ変換では不十分で、ウェーブレット変換などの周波数に依存した解析など工夫されているが、聴覚の能動的な特性を十分にモデル化したものではない。

記憶の脳神経モデルをAI技術に応用することを考えてみよう。記憶の脳神経モデルについては、筆者がまだ神経薬理学の実験を行っていた30年近く前から、脳の海馬におけるシナプス伝達の増強作用が関係しているらしいことは分かっていた。大きな前進があったのは、2014年度のノーベル生理学・医学賞、ジョン・オキーフ(John O’Keefe)博士、エドヴァルト・モーザー(Edvard Moser)博士、マイブリット・モーザー(May-Britt Moser)博士の場所細胞・グリッド細胞の研究だった(※参考4)。それぞれの細胞は、脳の海馬および、海馬への入力となる嗅内(きゅうない)皮質にあって、場所の認知と記憶に関与している。脳波のシータ波に位相同期して、場所細胞の興奮が制御されているという、従来の想像をはるかに超えた発見だった。脳の記憶は、場所細胞・グリッド細胞という空間認知のハードウェアに組み込まれながら、意識レベルと同期してダイナミックに読み書きされている。コンピューターのデータベースに先験的な属性を定義することはできるけれども、感覚入力を適切な属性に入力し、意識レベルと同期して再構成したり読み出したりする技術は想像すらできない。意識とは何かという大きな問題が、記憶の脳神経モデルの根幹につながっている。

◆人は感覚外の世界を計算できても理解できない

視覚と聴覚の認知モデルをコンピュータープログラムとしてAI技術に応用することを考えた。空間認知は意識や記憶と深くかかわり、容易にAI技術として応用できそうもないけれども、それは認知症を理解できない人類の限界でもある。現在の脳神経科学は急速に発展していて、その成果としての認知モデルをコンピュータープログラムとすることは、爆発的に増加するビッグデータを経済活動に活用する確実な需要がある。量子力学のように、計算はできても感覚世界とは大きく異なり、よく理解できない問題の場合、AI技術はあまり役立たないだろう。もしAI技術が正解を発見し、その正解をヒトは完全に理解できないとしたら、AIが「神」のようになってしまう。数学の問題で、4色問題をコンピュータープログラムが証明したときに、証明は理解できるし再現性はあっても、証明のプロセスが数学者(人間)にとってブラックボックスになる場合、それを証明と呼ぶのかどうかが問題となった。コンピュータープログラムに感覚外の世界からの「データ」を与える人間は、コンピューターの、もしくはコンピューターを支配する人間の奴隷になるのだろうか。

感覚外の世界のデータは偶然性またはランダムネスによって数学的に表現するしかない。計算可能なランダムネスを「確率」として数学的に理解できたとしても、計算可能ではないランダムネス、もしくは期待値は計算できても分散が計算できない確率や、量子力学の量子確率(数学的には自由確率ともいう)のような計算はできても直感的には理解できない確率の世界であっても、コンピュータープログラムは計算を行う。コンピュータープログラムの停止問題という原理的には計算不可能な問題であっても、計算のビット数を制限すれば、停止確率として計算可能になる。人間は理解できない計算結果としての未来予測を信じるだろうか。

本稿では宗教の立場からではなく、生命倫理を哲学的に再考して、AI倫理としての合意形成(コンセンサスメーキング)が可能という、科学技術への楽観主義的な立場から、AIが「神」とはならない、コンピューターとの共存・共生・共進化を模索している。

◆計算できない世界が未来を創る

哲学では「偶有性」として、アクシデント(事故)やコンティンジェンシー(不測の事態)、とても起こりそうもないことが起こってしまうことを、ランダムネス(偶然性)と区別することがある。確率計算としては無視できるほど小さい確率なのに、実際に起こると生死のように重大な結果をもたらしてしまう大きなリスクが顕在化すること、偶有性としてこの世界が出来ているという哲学的な立場だ。

宗教的に言い換えれば「奇跡」を信じるということだろう。この宇宙に生命が存在することは奇跡でしかないという感覚は、神の創造物としての宇宙を信じなくても、現在の自然科学でも同じような偶有性として了解するしかないという話だ。「奇跡」も計算できない。

20世紀の気象学者エドワード・N・ローレンツは、気象に関する決定論的な連立上微分方程式が、初期値に敏感で、ある時点から全く予想できないランダムな振る舞いを示す「カオス」を発見した(※参考5)。この決定論的カオスは生態学における集団サイズ変動の方程式や、セルオートマトンなど、いわゆる複雑系として至る所で発見された。このカオスも、計算できたとしても計算結果がランダムなのだから、偶有性や奇跡のようなものかもしれない。しかしカオスの場合は、計算結果の統計的な挙動は理解可能で、偶有性や奇跡とは異なる。複雑系の理論では決定論的な世界からカオスに移行する「カオスの縁」(※参考6)が、生命などの複雑なシステムを生成する理論としてもてはやされたことがある。カオスは計算可能な世界であって、計算できない世界がどのような世界なのか、計算できる世界と計算できない世界の関係などはほとんど分かっていない。

認知症を生きる人類と人工知能の話としては、認知症を生きる人類という計算できない世界と、人工知能という計算できる世界の接点を求めて、これまで15回も「住まいのデータを回す」話を続けてきた。そして筆者としても全く予想外の展開なのだけれども、計算できる世界と計算できない世界の接点は「ウイルス」なのだということに気が付いた。ウイルスは生物ではなく無生物でもない、「カオスの縁」のような存在と考えられてきた。しかしウイルスは生物でもあり、無生物でもあると考えたら、ウイルスは計算できる世界と計算できない世界の接点だということに気が付いた。ウイルスはコンピュータープログラムのウイルスでもありうる。言葉遊びではなく、言葉が想像力を先取りしていたのだ。

◆全体構想の見直し、ウイルスの世界を学ぶことが結論になる

本稿では広義のウイルスとして、タンパク質のない遺伝子だけのプラスミドと、遺伝子のないタンパク質だけのプリオンもウイルスの仲間と考える。ウイルスの世界については次稿で記載するとして、ネタ本は『ウイルス・ルネッサンス-ウイルスの知られざる新世界』(山内一也 著、東京化学同人、2017年)である。そのハイライトを紹介しよう。ヒトゲノム解読の結果、全ゲノム配列のうち、タンパク質を発現する構造遺伝子は1.5%しかなく、ウイルスの遺伝子とウイルス由来の塩基配列がヒトゲノムの中に50%ほど存在するという驚くべき発見があった。ヒトゲノムを10万円以下で解析できる次世代シークエンサー(DNAの塩基配列を決定する機械)が実用化され、世界中の海水を分析してみたら、膨大な量と種類のウイルスが発見された。従来、大規模な感染症の場合以外は、ウイルスの培養方法が分からなかったので、ウイルスの世界が知られていなかった、という単純な話だ。環境ゲノム解析をメタゲノムということもあり、人体の常在性ウイルスに関するメタゲノム解析(ヴァイローム)により、人体の各部分から、膨大な量と種類のウイルスが発見されている。ヴァイロームの場合、塩基配列として既知のウイルスは10%以下でしかなく、こんなに身近に未知の世界が広がっていた。ゲノムの中に、身体の中に、身体の表面に、海・空・土壌の地球環境の中に、私たちはウイルスの中で、ウイルスと共に生活している。

薬効の個体差を理解することが筆者のライフワークであり、遺伝子説と環境説のうち環境説を支持する立場でこのような文章を書いている。仕事では先天的な情報を与えるファーマコゲノミクス(解読されたヒトのゲノム情報にもとづいた薬理学)よりも、薬剤を投与する時点での画像診断が重要だと考えていた。しかしウイルスは遺伝子の発現を調節し、気象にも影響を与える環境そのものであった。そして次世代シークエンサーにより、各家庭でウイルスの分析ができるようになることも夢ではなく、ヴァイロームのビッグデータが近未来に待ち受けている。ウイルスが発現するタンパク質の分子進化は計算可能だけれども、ウイルスの数が膨大で超並列計算が必要となり、その進化速度はスーパーコンピューターの計算速度よりも早い。ウイルスの全体像は不明で、系統樹もない。しかしデータは急速に増加する。

本稿第5回(※参考7)において、本稿の全体構想をまとめ、その結論を以下のように結んだ……。「データ論」が社会変革の理論となりうるかどうかはよくわからないが、人がコンピューターと共存・共生する近未来において、人と人、人とコンピューター、コンピューターとコンピューターの独立性を高めるように行動すれば、多様で個性豊かな世界となることが期待される。近未来がその逆であった場合、人と人、人とコンピューター、コンピューターとコンピューターの独立性が失われるのであれば、「抵抗」するしかないだろう。「データ論」は抵抗する表現論でもある。

この結論部分に、ウイルスとヒトの共存・共生・共進化を追加し、ウイルスとコンピューターは人に寄生しながら人に影響を与えて「独立」に振る舞うこと、すなわち「独立性」は「自由」とは全く異質の概念で、「寄生」という共存・共生・共進化のメカニズムを内包しているという重要な修正が必要となった。ウイルスは人やコンピューターよりも先住者であって、ウイルスが人に抵抗することはあっても、人はウイルスに「抵抗」できない。できるのは、ウイルスの表現論を模索する程度のことだろう。

「データ論」はウイルスのデータ論であり、生態学を根源から再考することで社会変革の理論を目指すことになる。「住まいのデータ」も、自分自身と身の回りのウイルスのデータを集積し解析することで、認知症と共に生き、認知症を治癒可能な病気とする手掛かりを得たい。

参考1:TensorFlow、https://ja.wikipedia.org/wiki/TensorFlow

参考2:蝸牛、https://ja.wikipedia.org/wiki/%E8%9D%B8%E7%89%9B

参考3:時間周波数解析、http://www.asakura.co.jp/books/isbn/978-4-254-20092-8/

参考4;2014年度ノーベル賞、https://www.jnss.org/141031-03/

参考5;カオス、エドワード・N・ローレンツ (Edward N. Lorenz) https://ja.wikipedia.org/wiki/%E3%83%AD%E3%83%BC%E3%83%AC%E3%83%B3%E3%83%84%E6%96%B9%E7%A8%8B%E5%BC%8F

参考6;カオスの縁、https://ja.wikipedia.org/wiki/%E3%82%AB%E3%82%AA%E3%82%B9%E3%81%AE%E7%B8%81

参考7;住まいの多様体(その5)『住まいのデータを回す』第5回、全体構想

住まいの多様体(その5)『住まいのデータを回す』第5回

コメント

コメントを残す