п»ї 量子コンピュータはサイコロを振る 『データを耕す』第3回 | ニュース屋台村

量子コンピュータはサイコロを振る
『データを耕す』第3回

3月 03日 2017年 社会

LINEで送る
Pocket

山口行治(やまぐち・ゆきはる)

在野のデータサイエンティスト。元ファイザーグローバルR&Dシニアディレクター。ロンドン大学St.George’s Hospital Medical SchoolでPh.D取得(薬理学)。東京大学教養学部基礎科学科卒業。中学時代から西洋哲学と現代美術にはまり、テニス部の活動を楽しんだ。職業としては認知されていない40年前から、データサイエンスに従事する。冒険的なエッジを好むけれども、居心地の良いニッチの発見もそれなりに得意とする。趣味は農作業。

アインシュタインは「神はサイコロを振らない」と量子力学を批判した。しかし、カナダのベンチャー企業D-Wave Systems(※注1)が2011年に販売し始めた量子コンピュータは、サイコロを振る最高の実験装置のように見える。量子コンピュータは、スーパーコンピュータ(スパコン)が1年かかるような計算(サイコロを振る計算も含めた広義の計算)を一瞬でやってのける極めて高度な計算能力を持っている。こうした圧倒的な計算能力が広く世の中で利用されるようになったら――。その利便性とリスクなどについて、かねてからの持論を述べたい。

◆確率論そのものの奇妙さ

「神すなわち自然」と喝破して、近代の扉を開けたのはオランダの哲学者スピノザだった。冒頭のアインシュタインの言葉はもちろん、スピノザのいう「神」のことを言っている。高価な実験装置でしかない量子コンピュータが画期的なのは、もしかしたらインターネットの暗号を解読してネット世界を支配できるからだろう。現在のネット世界の支配者たちはその可能性におびえている。もっと現実的な可能性、量子コンピュータによってAI(人工知能)が飛躍的に進歩する可能性を否定するわけではないが、量子コンピュータを用いなくてもAIは確実に進歩し続ける。

アインシュタインが納得しなかったのは、量子力学の確率論的な解釈だ。アインシュタインは、その発見者であるイギリスの植物学者ロバート・ブラウンの名前にちなんだ「ブラウン運動」(※注2)を思考実験で定式化した天才だから、もちろん統計力学は熟知している。多数の粒子のふるまいが統計的であったとしても、単一の量子が確率的にしか記述できないことに納得していなかった。量子力学の奇妙さが、量子コンピュータの想像を絶する能力と関係していると思うかもしれない。しかし立ち止まって考えたいのは、確率論そのものの奇妙さだ。サイコロを振っている限りは、どこが奇妙なのかわからない。問題は確率を集合論の言葉で定義すること、すなわち「ボレル集合」(フランスの数学者エミール・ボレルの名前に由来)から始まる。

確率論におけるボレル集合は可能な事象を全て集めたものすごく大きな集合で、数学的な定義だけでは実感できない。最近、『Kac統計的独立性』(Mark Kac(マーク・カッツ)著、1959年、数学書房から2011年に邦語訳)を読んで、実数の「2進展開」はコイン投げの数学的な表現であること、ボレルが考えていたことの一端を学んだ。確かに実数は乱数の性質を数学的な意味で厳密に表現しているけれども、取り扱いにくいので、非常に大きな素数を分母とする疑似乱数が実用化されている。素数の性質が乱数(確率論)の数学的な基盤とつながっていることを、カッツは「素数はサイを振る」と記述している。アインシュタインは、まさか素数がサイコロ遊びをするとは思わなかっただろう。

◆「コンピュータにとっての自然はデータである」

確率論だけではなく、数学全体が奇妙だと言ってしまえば元も子もないが、コンピュータは数学的な万能計算機なのだろうか、それとも物理的な実験装置なのだろうか。その両者をつなぐ確率論はAIにも負けないくらい発展の可能性を秘めている。地球で生命が誕生する確率、宇宙に生命が存在する確率など、怪しい確率計算では分母の不確定さが本質的だ。分母の確率的解釈をボレル集合が数学的に正当化しても、怪しい確率であることに変わりはない。

パスカルは確率を賭博の問題と考えて、「神が存在する」ことに賭けた。スピノザは可能性を限りなく肯定して、「神が存在する」ことを証明した。存在しない神はサイコロを振らない。私たちが確率を自然科学の一部として受け入れる近未来では、「コンピュータにとっての自然はデータである」という「データを耕す」の筆者が主張する怪しげな仮説も、同じく無批判に受け入れられるのだろう。

確率と統計の大きな違いは、確率にはサイコロが必要であり、統計にはデータが必要なことだ。一般的な考えでは、データには誤差が不可分であるため、不可知の誤差を確率的にモデル化することで、統計と確率がつながる。しかしコンピュータにとってはデータが自然であり、真理はデータの中にしか存在せず、誤差もデータの一部でしかなくなる。より正確には、誤差をモデル化するときのパラメータがデータとなる。

こういった考え方は、イギリスの数学者トーマス・ベイズの名前に由来する、未知のパラメータを推定するためにパラメータそのものも確率的に分布していると考える「ベイズ統計」(※注3)と相性がよい。従来の頻度論的な考えでは、例えばデータが100件あるとき、それを二つのパラメータ(平均値と標準偏差)の統計モデルで表現できれば、データが意味する本質的な(情報論的な)理解に近いと考えていた。ベイズ統計ではデータが100件でも、パラメータが100個あるモデルも排除しない。ベイズ統計では情報は縮約されるのではなく、ありのままに表現されることを好んでいる。

◆遠い未来のおとぎ話

量子コンピュータもAIも、ともに最先端の技術であるとともに、産業的なインパクトが限りなく大きい技術革新であることは確かだ。もちろん米国が先行している。しかし、コンピュータにとって「データすなわち自然」というテーゼは、スピノザが「神すなわち自然」と考えた近代哲学とどれほど遠い位置にあるのだろうか。少なくとも、万能計算機を初めて夢見たライプニッツにとっては半歩先だったに違いない。

コンピュータ技術の進歩は、産業的なインパクトというよりも経済的なインパクトが限りなく大きい技術革新といったほうが正確だろう。経済的な貧富の差を拡大する技術を正当化することは困難だ。半歩先の進歩は絶対的な貧富の差では決してない。貧乏人の1万倍の収入がある成功者であっても、寿命は1.2倍(?)程度しか長くはない。量子コンピュータやAIを理解できる億万長者はいなくても、量子コンピュータやAIに投資して儲けるのが億万長者なのだ。

否定的に考える必要はない。99%の貧乏人にとって、量子コンピュータやAIがどのような意味があって、何の役に立つのかという正当な疑問を忘れないようにしよう。間違いなく医療を改善するのに役立つはずだし、戦争を防止することもできるかもしれない。

自然がサイコロを振ることを認めさえすれば、億万長者もサイコロ遊びの仲間となる。AIでコンピュータがヒトの心を理解できるようになるというのは遠い未来のおとぎ話だ。物語はデータサイエンティストが、コンピュータの心を理解することから始まる。

◆経済優先の価値観を見直すきっかけに

簡単な結論を述べよう。現在の産業的な問題、特に医薬品産業にとって、量子コンピュータは不必要であって、安価なパソコンを活用するだけで十分な問題がたくさんある。ただし、本来患者自身のものである医療データは国家や大企業によって独占され、経済的な価値が優先されて、医療の進歩に十分には役立っていない。産業的な意味で不必要な量子コンピュータについて、長々と難解な話をしてきたのは、それでも「自然すなわち量子コンピュータはサイを振る」という自然観が、経済優先の価値観を見直すきっかけになると考えたからだ。

マイクロソフト、インテル、グーグル、フェイスブックのCEO(最高経営責任者)である億万長者は、医療の進歩のために資金的および患者目線での寄与を行っている。アップルのCEOはその時間すらなく他界した。自分自身のものである遺伝情報は、明らかに先祖のものでもある。自然のサイコロはごくわずかの突然変異と、大胆な性的交配として明確な役割を担っている。そして、正常と異常を識別するのは個人ではなく、集団としての性質でしかないように思われる。

「データを耕す」のテーゼは繰り返さないが、実際に耕しているのは個体差をもったデータだ。遺伝的な個体差が個人的なものであるのに、表現型としての個体差は集団的にしか識別できないのは何故なのだろうか。次回は「データを耕す」中心的な課題を紹介してみたい。

※関連記事のURLは以下の通り
(注1)https://ja.wikipedia.org/wiki/D-Wave_Systems
(注2)
http://www.gakushuin.ac.jp/~881791/docs/BMNESM.pdf#search=%27%E3%83%96%E3%83%A9%E3%82%A6%E3%83%B3%E9%81%8B%E5%8B%95%27
(注3)http://heartland.geocities.jp/ecodata222/ed/edj1-1-6.html

コメント

コメントを残す