п»ї 波風雲の技術 『みんなで機械学習』第29回 | ニュース屋台村

波風雲の技術
『みんなで機械学習』第29回

10月 16日 2023年 社会

LINEで送る
Pocket

山口行治(やまぐち・ゆきはる)

o株式会社ふぇの代表取締役。独自に考案した機械学習法、フェノラーニング®のビジネス展開を模索している。元ファイザージャパン・臨床開発部門バイオメトリクス部長、Pfizer Global R&D, Clinical Technologies, Director。ダイセル化学工業株式会社、呉羽化学工業株式会社の研究開発部門で勤務。ロンドン大学St.George’s Hospital Medical SchoolでPh.D取得(薬理学)。東京大学教養学部基礎科学科卒業。中学時代から西洋哲学と現代美術にはまり、テニス部の活動を楽しんだ。冒険的なエッジを好むけれども、居心地の良いニッチの発見もそれなりに得意とする。趣味は農作業。日本科学技術ジャーナリスト会議会員。

◆制作ノート

英国の経済学者エルンスト・シューマッハー(1911~1977年)の「スモール イズ ビューティフル」における中間技術の提案を、「みんなの機械学習」として実現するため、「スモール ランダムパターンズ アー ビューティフル」という拙稿を連載している。前稿では、ビッグデータの限界と、スモールデータの活用について考えてみた。近代合理主義は17世紀に始まり、限界や問題点が明らかになっても、21世紀まで存続している。スモールデータの機械学習が、新しいデータ文明の始まりとなることを期待して、近未来への希望をつないでいる。「スモール ランダムパターンズ アー ビューティフル」は途中の画像以降なので、制作ノートに相当する前半部分は、飛ばし読みしてください。

「スモール ランダムパターンズ アー ビューティフル」のゴールは、結論を論理的に構築することではなく、生活世界において、データの世界との共存・共生・共進化に希望を実感することにある。近代的なモノの価値に従属する経済から、コト(サービスなど)の意味を重要視する経済への移行を時代背景として、近未来のデータサイエンス テクノロジー アンド アート(データの世界)が、人類の文明論的な変革をもたらす夢物語を、少なくともディストピアとはしない、複数の探索路を切り開こうとしている。物語のゴールにおいては、意味が認知される以前の「データ」そのものが、みんなの機械学習によって、「言語」とは別の、文明の道具になるだろう。

◆過去・現在・未来

機械学習との共存・共生・共進化は、コンピューターの過去・現在・未来に対応する。コンピューターは、万能計算機として、300年前に構想され、第2次世界大戦後の米国において、ビジネスマシンとして実用化された。万能計算機ではあっても、実行中のプログラムが停止するのかどうか、判定する方法は無いことが、数学的に証明されている。プログラムの停止確率Ωが、代数的には計算できない実数(超越数)であることなど、万能計算機には、数学と論理の奥義が潜(ひそ)んでいる(『メタマス!―オメガをめぐる数学の冒険』〈グレゴリー チャイティン、白揚社、2007年〉)。現在のコンピューターは、AI(人工知能)技術によって、様々な応用課題で、人間の能力を超えつつある。量子コンピューターという、量子力学における、自然現象の奥義を直接応用する、万能計算機が実用化されつつあり、軍事技術として、活発に研究開発されている。コンピューターの未来は、機械学習と人びとの共進化になるというのが、筆者の見立てだ。コンピューターと軍事技術との共進化は、すでに核爆弾で共生の限界を超えてしまっているため、未来は無いと考えている。

過去・現在・未来は、物理現象としては、時空間における時間軸に過ぎない。物理学における近代合理主義の始まりとなったニュートン力学では、運動方程式が時間軸に対して可逆だ。哲学としては、過去も未来も、時間に可逆な「決定論」の立場となる。アインシュタインは、光の速度の不変性によって、時間軸のスケールが変化することを発見したが、決定論の枠組みの中にある。重力の理論である一般相対論では、宇宙の構造を方程式で表現する場合、ビッグバンと、現在の宇宙の膨張を予測できたけれども、ビッグバンの前と、宇宙の未来、ブラックホールの中の別の時空間については、何もわからない。アインシュタインの立場では、物理学によって、過去と未来を記述できても、現在は点でしかなく、人間の実存的な直感や、量子論とは、相いれないところが多い。量子論の立場から、関係の継起だけが意味がある、という主張もあり(『時間は存在しない』〈カルロ・ロヴェッリ、NHK出版、2019年〉)、物理学における時間の理解は、いまだ確定したものではない。一方で、理論化学(熱力学・統計力学の応用分野)においては、エントロピーの増大など、時間の不可逆性(時間の矢)が、人間の直感および化学現象と、矛盾なく説明できている。

◆未来の生態学的イメージ

生態学的、および進化論的には、過去・現在・未来はどのようなイメージだろうか。まばらでゆらぐ多様性について考えている筆者としては、カルロ・ロヴェッリのように、時間は関係の継起でしかないように思える。まばらな関係が不連続に出現して、それでもどこかには、ゆらぐ長期記憶があるかのように見える。古典物理学では理解できない、量子の波動性のような世界(参考:世界で一番美しい科学実験、誰も見たことがない世界を観る、https://www.youtube.com/watch?v=lp1xgTCLNe0)が、個体差を含むデータの世界にも見いだされるのではないか、と考えている。

進化論のイメージでは、生命が地球で誕生してから、単細胞生物から多細胞生物へと、不連続かつ断続的に、多様性が増大して、系統樹に表現される複雑な生態系へと進化している。エントロピーの増大法則そのものだ。複雑な生態系のイメージでは、弱肉強食的な食物連鎖の三角形というよりは、森の樹木が作る、菌類と根の共生ネットワークのイメージのほうが現代的だろう。そこで、進化論的な系統樹と、菌根菌ネットワークのイメージを合成して、太い幹から、次第に細く分枝する根を経て、最終的に土中で繋(つな)がったり切れたりする、蜘蛛(くも)の巣のような菌根菌ネットワークをイメージしてみよう。太い幹と根が過去の出来事で、樹木の近傍で共生する菌根菌ネットワークが現在の状態に対応して、未来は地中にひろがり、手探りで進むイメージだ。

◆過去の衣・食・住と未来の波・風・雲

人びとの生活は、衣・食・住によって支えられ、過去の文明を作り出してきた。縄文文化のような、地球に分散する先史時代の文明と、都市国家や産業革命をリードしてきたヨーロッパ文明を比較すると、地域特性としては、衣・食・住という生活の多様性が失われる逆進化のように見える。しかも、ヨーロッパ文明における生活の多様性は、産業革命以降の技術の急速な変化と、市場経済による社会の不安定化によって、社会集団の分断が進み、生活の不確実性へと変質している。予測困難な状況での「さまざま」というよりも「それぞれ」の生活となってしまった。生態学的および進化論的な多様性が失われ、熱力学的なエントロピーの増大だけが進行する、不可逆でゆらがない、まばらではなく権力が集中した、持続不可能な状況だ。急速に進み過ぎた社会的変化は、例えば人口減少のような、折り畳みとなって、不連続で非線形な社会現象となるだろう。言語の世界からデータの世界への変化も、生活のレベルで見れば、過剰な技術による折り畳み現象の一種と考えられる。

過去の事象は、調査をすれば、確定的な事実となる。現在の事象は、過去のデータから推定して、予測することで、実際に観測される事実との誤差、予測精度を評価できる。現在は、直近の過去から近未来まで、ある程度の幅を持って、実感できる。しかし、本当の未来は、予測するものではなく(予言を信じれば別の話)、構想して、みんなで構築するものだろう。未来への構想は、個人的な夢想から始まる。筆者の夢想は、ヨーロッパ文明が過剰に生産して消費する、衣・食・住の生活を折り畳んで、波・風・雲の生活を、未来のデータ文明に発見することにある。波は電磁波として、現在のデジタル技術を支えている。風は、生活環境を読み解くオルタナティブデータとして、まばらでゆらぐ多様性を評価し、近未来への社会変革を導く。雲は空の存在を示唆する。空は、空気であり、宇宙に向けて真空に近づき、ついには光がほとんどない宇宙からの視点を与える。ほとんど光がなくても、光の幾何学的合理性を超える、光量子(波動性と粒子性を同時に示す)であれば、発電をして計算もできる。波や風は発電はできても、計算はできない。計算する光は、未来への希望となるだろう。

◆データ技術の衛生管理技術

衣食住に関連する産業技術は、特に近代の産業革命以降に、人びとの生活を大きく変革した。個々の技術や製品は、技術の進化論的な多様性によって、生活の隅々まで、人びとの要求や欲望を満たしている。しかし目立たないけれども、画期的な技術革新は、衣食住の衛生管理の技術だろう。電気洗濯機、電気掃除機に加えて、トイレや下水の技術も、近代以降の都市生活を快適なものにしている。

波風雲のデータ技術は、人びとの要求や欲望を満たすだけではなく、それらの技術の衛生管理も必要不可欠だ。動物の脳が睡眠を発明したように、コンピューターやAI技術にも、自律的な衛生管理の機能を発明する必要がある。コンピューターやAI技術にとっての衣食住は、電気とデータだ。データマネジメント業務の自動化は、その第一歩になるだろう。未来への希望を雲から夢想する「空」に求めているのは、むやみに前向きな生き方に希望を見いだすのではなく、ひきこもりや無力感も含めて、未来への構想を、プラスマイナスゼロの近くで考えたいからだ。人びとの生活を支え、手探りで未知の可能性を探索しながら発見する、人びとをつなぐ場としての「空」をイメージしている。理想主義で、未来への希望を考えているつもりはない。近代文明の負の遺産の大きさを実感しながら、近代合理主義の限界を超えるために、言語ではないデータに、最後の希望を見いだそうとしている。

◆まばらでゆらぐアート

前稿では、近藤譲の「線の音楽」を紹介した。同氏のアルバム「ブルームフィールド氏の間化」には、蝉(せみ)の声をピアノの音と重ねた素晴らしい「まばらでゆらぐ」音楽もあるのだけれども、Spotify®では見つけられない。アートでは、「まばらでゆらぐ」絵画は、たくさんありそうで、実は難しい。最近では、デイビット・ホックニー展の「四季、ウォルドゲートの木々」が、デジタル技術を駆使して、36枚のゆらぐ画像を同期していた。イギリス人巨匠の、衰えることのない創作意欲に敬意を表したい。筆者が「まばらでゆらぐ」アーティスとして感銘を受けたのは、拙稿『WHAT^』第12回「積分形式の美意識、もしくは圏論としての哲学」(2018年12月26日付)と第29回「リー・キット再訪」(2020年1月15日付)で紹介した中国系作家Lee Kitだ。特に、原美術館での個展において、建物の内外を窓の光でつなぐだけではなく、作品としての「壁」まで、さりげなく作ってしまった。この壁について、ネタバレになるのか、解説している記事を探すのは容易ではなかった(リー・キット「僕らはもっと繊細だった。」)。分断しない壁、原美術館の歴史的建築物が背負った負の歴史を、批判するのではなく、無化するのでもなく、若い柔らかい感受性が、表現の現場とした。限りなく淡い光を求めたLee Kitであれば、近代絵画の光は、まぶしすぎるはずだ。プロジェクターのLEDの光も、まぶしい。原美術館の窓からの、植物たちのゆらぐ日差しを見事にとらえた作品は、原美術館と共に消失した。人びとの希望は、光とともにあるのではない、もちろん闇ではなく、希望自体が人びとをつないでゆく、菌根菌のような表現のネットワークを信じたい。

ゆらぐ空白 筆者撮影 2023年10月2日

 

『スモール ランダムパターンズ アー ビューティフル』
1      はじめに; 千個の難題と、千×千×千×千(ビリオン)個の可能性
1.1   個体差すなわち個体内変動と個体間変動が交絡した状態
1.2   組織の集合知は機械学習できるのか
1.3   私たちは機械から学習できるのか
2      データにとっての技術と自然
2.1   アートからテクノロジーヘ
2.2   テクノロジーからサイエンス アンド テクノロジーへ
2.3   データサイエンス テクノロジー アンド アート
2.4   データサイクル
2.5   データベクトル
2.6   局所かつ周辺のベクトル場としてのデータとシミュレーション
3    機械学習の学習
3.1 解析用データベース
3.2   先回りした機械学習
3.3   職業からの自由と社会
3.4   認知機能の機械学習とデジタルセラピューティクス(DTx)
3.5   学習は境界領域の積分的探索-ニッチ&エッジの学習理論
3.6   機械学習との学習
4    機械学習との共存・共生・共進化-まばらでゆらぐ多様性
4.1 生活と経済の不確実性
4.2   生活と経済に関連する技術は、何を表現しているのか
4.3   スモール データ アプローチ-個体差のまばらでゆらぐ多様性(前稿)
4.4   まばらでゆらぐ多様性の過去・現在・未来(本稿)

拙稿で探索している、コンピューターもしくはAI技術との共進化は、現在の延長としての近未来ではなく、みんなで構築する本当の未来だ。中世における宗教の権威が衰えたように、近代の政治や経済における「合理性」が、論理と権威によって支えられたものでしかないことが明らかになっている。問題は、近代を乗り越える現代ではなく、人びとの未来がないかもしれないということだ。政治は無責任で、経済は強欲であり続けている。人間社会の、上部構造も、下部構造も、明確に機能不全であり、人びとの未来に希望を与えていない。例えば、米国中心の世界という妄想は、軍事としては正論であっても、食卓では妄想でしかない。その妄想が、コーラ(またはコーヒー)とハンバーガーによって、人びとの生活の中心となってしまった。豊かな食文化を育んできた、中国料理や、インド料理、ましてや日本食は、米国の政治・経済とは無関係だ。食卓においては、ヨーロッパ文明は否定しがたいけれども、米国が世界の中心だと思えるのは、よほど味覚の衰えた前世紀の政治家だけだろう。

筆者としては、怒ってもいないし、諦めてもいない。戦争も含めて、多数の人びとを殺害したり、もっと多くの人びとが自殺をするのは、政治や経済の問題よりも、文化や文明の限界だと思う。こういった難問を解決できるとしたら、問題を作り続けている、政治や経済ではないはずだ。『そして誰もいなくなった』(アガサ・クリスティー)は、孤島だったかもしれないけれども、誰もいなくなるのは、未来の地球かもしれない。多くの哲学者が、近代哲学からの決別を語っていても、言語を捨てる決意をしたした哲学者は、筆者としては、現代数学の開拓者であり究極の平和主義者、アレクサンドル・グロタンディーク以外には知らない。筆者としては、言語を捨てるのではなく、言語に多くを期待しないで、過剰に進歩した産業技術を、生活世界に折り畳む技術革新として、データから機械学習する可能性を模索している。

コンピューターもしくはAI技術との共存・共生・共進化は、300年前の、近代哲学のスーパースター、ゴットフリート・ライプニッツによる万能計算機の夢想から始まった。万能計算機が、動作確認すらできていない設計図の時代に、コンピューターサイエンスを確立したのは英国の数学者、アラン・チューリングだ。機械仕掛けの万能計算機は、暗号解読の軍事技術に役立った。コンピューターがビジネスマシンとなったのは、第2次世界大戦後の米国で、現在のスマホとAIビジネスまで、米国は世界の情報ビジネスをリードしている。しかし、AI技術が、ビジネスだけではなく、教育・医療・司法などの社会基盤に、破壊的な変革をもたらすことは確実だ。米国は、世界中の社会変革をリードできないし、責任も持てない。未来のコンピューターとの共進化は、世界中の人びとの課題であり、まずは生存環境を確保して、多様性を育みながら、新しい文明と共に共進化する。

近代の産業革命以降、衣食住など、生活関連の産業技術は、生活の隅々まで浸透して、経済に支配される生活様式となった。自然環境との調和よりも、電気洗濯機、電気掃除機、トイレと下水の技術など、衣食住関連の衛生管理技術が、都市生活を支えている。コンピューターもしくはAI技術においては、過剰に進化した新機能に投資が集中するけれども、衛生管理技術は、とても貧弱もしくは発展途上だ。データサイエンス・テクノロジー&アート(DSTA)が、人びとの生活世界に折り畳まれて、データの世界と共存・共生・共進化する未来の生活には、データの衛生管理技術が不可欠だ。データの不正使用や、データを使う犯罪は、現在の政治・経済の問題だ。技術的な対策で解消できるとは思えないけれども、経済格差などの社会問題に対処することで、従来の防犯活動の枠組みに、技術的なオプションを加えることはできるだろう。日常的なデータの衛生管理技術としては、データの欠測や外れ値を検出して補完する、データマネジメント業務の自動化が、はじめの一歩になる。データの機械学習によって、近代文明の負の遺産である「生活の不確実性」を、特定の個人と個体集団の近傍から解きほぐしてゆく作業について、次節でもう少し詳しく考えてみたい。

衣・食・住に加えて、データと共に生きる生活を波・風・雲のイメージで考えてみよう。波は、電磁波であって、ラジオやテレビのアナログな時代から共存が始まり、スマホやインターネットのデジタル技術は、人びとの生活に不可欠な「共生」の段階になっている。風は、第4章のテーマである「まばらでゆらぐ多様性」のイメージで、風の同時多点測定によって、都市や川の流域の「生きた地形」をとらえて、近未来の生活や経済における、オルタナティブデータとして活用することを考えている。雲は、空を背景とする、宇宙に向けた地球のイメージで、見えている雲ではなく、見えない空(空白)、電磁波が伝わる真空な空間におけるデータ技術を想定している。

グロタンディークは空間を離散化して、代数幾何学を厳密な数学とした。デカルト座標で表現される2次曲線は、代数方程式で記述される図形であり、ニュートンの運動方程式における砲弾の軌跡でもあったけれども、実数の性質に依存した図形でしかなかった。もし、座標軸が実数ではなく、有理数であったら、図形は意味があっても、全ての図形が微分不可能となって、代数的な方程式で表現できる保証がなくなる。有理数にルートで表現される無理数を加えれば、ピタゴラスの方程式で表現できる直角三角形が構成できる。通常は、実数の性質に依存した「近傍」を集合で定義して、位相(図形)を数学で取り扱えるようにする。グロタンディークは近傍の定義には、「順序」が必要十分であることを証明して、有理数で表現される離散的な「近傍」によって、厳密な代数幾何学が構成できることを示した。連続的な空間は、離散的な空間の近似でしかないという考え方だ。

時間の離散化については、量子論の立場から、関係の継起だけが意味がある、という主張もある(『時間は存在しない』〈カルロ・ロヴェッリ、NHK出版、2019年〉)。時間は存在しないのではなく、同位相で連続的な時間軸はないというほうが正確だろう。そもそも、量子論の立場では、測定されるまでの状態は、複素数の方程式で記述されるけれども、物理的な状態としては確定したものではなく、測定された瞬間に状態が確定する。測定できるのは誤差をともなう有理数の世界だけなので、時間も空間も離散的なものでしかない。量子論に象徴的なのは、連続的な複素数の波動方程式で記述された電子が、測定されるときには粒子として、離散的にふるまうという事実だろう。筆者は数の実在性を信じる、強い実在論者ではあるけれども、最近は、実在するのは有理数までで、無理数・実数・複素数などは、方程式の実在性を信じる立場で再考するしかないと考えるようになった。

過去・現在・未来は、直感的には自明であっても、物理的には謎が多い概念だ。その謎の多くは、確率の解釈に関係していて、データ論としても重要な課題となる。哲学の文脈では、近代の弁証法の影響下にある場合、未来の事象について、近代の超克とか、近代を乗り越えるといった表現が多用される。筆者としては、近代の過剰を折り畳む、という表現によって、弁証法を無効化しているつもりだ。未来の事象については、不連続で重層化した、進化論的で、スケール変換が可能な時間軸を想定している。波風雲のデータサイエンス・テクノロジー&アート(DSTA)は、データを言語のように身近に感じながら、まばらでゆらぐ個体集団データの近傍を、伸ばしたり縮めたりしながら、蜘蛛の巣のようにつないでゆく、未来への足掛かりだ。

脳の機能、もしくは生理学的に考える過去・現在・未来は、過去が記憶に対応して、現在は、意識や感情に対応する。近未来は、予測できるとしても、未来への希望は、個人の喜びの感情と共に、個体近傍の個体集団に、生態学的または進化論的に引き継がれてゆくのだろう。逆に考えて、未来への希望を共有できない、個人(場合によっては集団や国家)の、離散化した空間と時間がゆらがなくなり、社会の中で孤立して、社会が分断されてゆくのだろう。波風雲のDSTAが、まばらでゆらぐ個体集団データの近傍を発見して、近傍相互をつなぐメタアナリシスを試行錯誤することで、人びとの離散化した空間と時間をつないでゆく物語を、未来への希望として、拙稿を続けている。

◆次回以降の予定
4.5生活の不確実性を予測する
4.6弱い最適化-脆弱性/反脆弱性からのスタート
4.7ひとつのビッグ予測、たくさんのスモール適応

※過去の関連記事は以下の通り
『WHAT^』第12回「積分形式の美意識、もしくは圏論としての哲学」(2018年12月26日付)

積分形式の美意識、もしくは圏論としての哲学 『WHAT^』第12回


『WHAT^』第29回「リー・キット再訪」(2020年1月15日付)

リー・キット再訪 『WHAT^』第29回、@^3

--------------------------------------
『みんなで機械学習』は中小企業のビジネスに役立つデータ解析を、みんなと学習します。技術的な内容は、「ニュース屋台村」にはコメントしないでください。「株式会社ふぇの」で、フェノラーニング®を実装する試みを開始しました(yukiharu.yamaguchi$$$phenolearning.com)。

コメント

コメントを残す