п»ї 行動の予定と、予定がない行動 『みんなで機械学習』第13回 | ニュース屋台村

行動の予定と、予定がない行動
『みんなで機械学習』第13回

12月 15日 2022年 社会

LINEで送る
Pocket

山口行治(やまぐち・ゆきはる)

o株式会社ふぇの代表取締役。独自に考案した機械学習法、フェノラーニングのビジネス展開を模索している。元ファイザージャパン・臨床開発部門バイオメトリクス部長、Pfizer Global R&D, Clinical Technologies, Director。ダイセル化学工業株式会社、呉羽化学工業株式会社の研究開発部門で勤務。ロンドン大学St.George’s Hospital Medical SchoolでPh.D取得(薬理学)。東京大学教養学部基礎科学科卒業。中学時代から西洋哲学と現代美術にはまり、テニス部の活動を楽しんだ。冒険的なエッジを好むけれども、居心地の良いニッチの発見もそれなりに得意とする。趣味は農作業。日本科学技術ジャーナリスト会議会員。

◆制作ノート

前稿(『みんなで機械学習』第12回)では、集団の個体差について考えてみた。個人の個体差から集団の個体差へと議論を展開するこの部分が、本論の主要な主張であり、難解かつ仮説でしかない試論である。理想気体の熱力学と統計力学をモチーフとしていて、個人主義と集団主義(正確には組織の周辺主義)を矛盾なく統合しようという、野心的な試みだ。予想通り、難解な文章になってしまったので、多少解説を加えてみたけれども、もっと難解になったような気がする。難解だということだけを理解していただけばよいのかもしれない。実際は、論理や文章ではなく、データと試行錯誤によって、理解を深めるしかないのだろう。

◆集団の個体差は難解な問題

個体差という、抽象的な概念であっても、データから個体差を推定する技術は具体的な問題だ。その技術が「集団の個体差」を分析対象とする場合は、合理的な説明が可能であるかどうかという以前に、合理的であること自体が危険なのかもしれない。テロリストのように、危険な人物は歴史的に多数存在したけれども、合理的な機械学習技術が危険かどうか、歴史は教えてくれない。もっと正確に議論しよう。合理的な機械学習技術が危険かどうかということは、機械学習技術の問題ではなく、合理主義自体の問題だ。キリストが処刑されるようなリスクがあったとしても、絶対的な信仰は揺らがないという信念が、合理主義の原点にある。原子力発電や核兵器のような、人類絶滅に直結する危険な技術と共に生きてゆくしか選択肢がない、わたしたちにとって、信念としての合理主義はリスク管理の観点から、割り引かざるを得ないのだ。合理性、すなわち理論的に正当化しうる考え方は、学校教育の考え方でもある。少なくとも、学校の試験では、不合理な回答は評価されない。ビジネスや政治の世界が、必ずしも合理的ではないとしても、量子力学も合理的な説明ができないし、物質の世界が合理的である保証はない。別の見方をすれば、集団の個体差は、社会的な問題の原因であり帰結でもあるのだから、単純な因果関係は仮定できない。集団の個体差を機械学習する技術は、具体的なデータとともに、慎重な実験を繰り返して、評価方法そのものを再考する必要がある。国家や企業が、安易に合理的な倫理基準を策定することは、人びとの未来をディスカウントしているとしか思えない。

◆予測する機械

人間の脳、もっと広義に生命は、予測制御装置と考えることができる(『自由エネルギー原理入門-知覚・行動・コミュニケーションの計算理論』〈乾敏郎・阪口豊、岩波書店、2021年〉)。予測のためには、知覚入力から外界のモデルを推論するだけではなく、実際に予測に基づいて行動し、より能動的に推論・学習することも重要だ。予測するということを、日常生活においてマクロに考えると、自分自身の日常生活や行動において、予定を作成するということでもある。予測は、統計理論や機械学習技術が得意とする機能だ。しかし、個体差にともなう不確定性が無視できない状況においては、統計理論の予測があまり役に立たないので、予測精度を向上するためには、大量のデータを駆使するか、人間の認知能力を超えた迅速な判断が要求され、機械学習技術にとっても、正確な予測は困難な課題となる。最近の機械学習では、データ不足を補うために、学習に必要な知識をデータ外から取得して活用する転移学習や、学習に有用な事例に対して適応的にアノテーションを行う能動学習(または適応的実験計画)が工夫されている。筆者が探求している「個体差の機械学習技術」フェノラーニングは、転移学習と能動学習の両方の側面を持ち、もっとダイナミックに、わたしたちが機械から学習して、機械学習法を最適化するための小さな実験を継続的に行うことを特徴としている。機械がわたしたちから学習し、わたしたちも機械から学習する。AI(人工知能)プログラマーの行動や判断を、専門家とは限らないわたしたちでも試行できるように機械が支援しながら、機械が学習する。難しいシステムを想定しているのではない。機械学習用のデータをデータマネジメントするプロセスまで含めて、機械学習することを提案している、シンプルなアイデアだ。

◆表現としての個体差

フェノラーニングのアイデアはシンプルなのだけれども、個体差をともなうデータのデータマネジメントは、長年の経験と直感が頼りの、標準化しにくいプロセスなので、簡単に実現できるアイデアではない。筆者としても、30年以上の実務の後に、少なくとも10年間は考えて、やっと入り口に立った気がしている。その入り口とは、「個体差は、個体差の表現の個体差である」というテーゼだ。個体差の表現は、個体差を増幅したり、逆に隠したりする。性差による個体差を想像すれば、ほぼ自明だろう。生物にとっての個体差は、個体識別の標識になっている。個体識別は、同種であれば本能的な、ほとんど学習を必要としない認知機能であっても、異種の場合は、性差と年齢ぐらいしか直感が働かない。同種であっても、地理的な影響や文化の差異も、個体識別にとって重要になる。こういった事情は、個体差の表現について考えて、特に「表現の場」の影響について考えると理解しやすい。表現論としては、表現するもの、表現されたもの、表現が共有・伝播(でんぱ)される表現の場という、表現の三つの構成要素を考えることになる。個体差の表現の場合、表現するものと表現されたものが同一の個体で、表現の場は家族から社会まで、状況によって多面的で多重な階層構造がある。前稿で議論したような、集団・組織・社会の個体差の場合は、何が表現されているのか、表現の構成要素が不明瞭な場合がほとんどだろう。組織の個体差は難しい問題なのだけれども、政治やビジネスで重要になる集合知を機械学習するためには、避けて通れない課題だ。

◆周辺主義(マージナリズム)と熱力学

社会的な「組織」の個体差を、組織の中心部ではなく、組織の内外を区別する境界をぐるっと廻(まわ)る周辺においてとらえる考え方を、周辺主義(マージナリズム)と名付けてみた。マージナリズムは熱力学と相性が良い。熱力学では、系と環境が世界を構成し、系と環境を出入りする仕事と熱の法則を明らかにする。系には温度、内部エネルギー、エントロピーなどの状態量が定義され、仕事や熱は、系と環境を出入りするプロセスとして理解される。生物の個体や、生体内の反応が、熱力学として理解されることはよく知られている。生命が作り出す秩序を、負のエントロピーとするのか、地球環境自体が非平衡系であることから、生物を含むエントロピー増大の法則を説明するなど、詳細は議論が継続しているけれども、生体はマクロな熱力学とともに、ミクロな統計力学によっても矛盾なく説明できるようになってきた。オーストリアの物理学者、ボルツマン(1844-1906)は、原子論的な理想気体によって、熱力学を統計力学によって記述することに成功したけれども、当時の物理学者には受け入れられなかった。生体がマクロな熱力学によって記述され、しかもミクロな統計力学とも矛盾しないなどということは、ボルツマンでも想像を絶する新展開だ。

◆社会集団における自由エネルギーとエントロピー

生体だけではなく、集団としての組織や市場までが、系と環境を抽象化したマクロな熱力学や、情報理論を取り込んだミクロな統計力学によって記述できるようになるかもしれない。理論が先行して、データを理論によって解釈しようとしても、集団の個体差の場合は、私たちが状態量やプロセスが何を意味しているのか理解できるようになるのには、相応の試行錯誤が必要だろう。市場にも、温度や内部エネルギー、エントロピーが定義できるとしても、会社はM&A(企業合併・買収)によって合併したり、破産したりする。理想気体のような物理的なプロセスというよりも、化学反応をともなう、不可逆的な非平衡系で、生体に近い化学的なプロセスと考えられる。化学的なプロセスは、自由エネルギーによって巧みに記述される。集団にとっての自由エネルギーとは何か、集団の個体差を機械学習する機械から、学習したいことはたくさんある。その中でも、集団にとっての自由エネルギーが、社会の経済的格差と関係するかもしれないという筆者の直感を、機械学習する機械から学習したい。学習意欲はあるのだけれども、このような学習課題は予測不能で、予定がない行動としか言いようがない。機械から学習するときには、根拠のない直感はあるのだけれども、予測不能で予定がない課題こそ重要なのだろう。データサイエンスのつもりが、芸術家とあまり変わらない話になってきた。

◆「スモール・ランダムパターンズ」のイメージ

現代の絵画は、技術(工業的な技術であって、描画技術ではない)とイメージ(社会に氾濫〈はんらん〉するイメージであって、画家の内面的なイメージではない)が交絡する地点から出発する。画家は生活することが表現となり、表現は画家個人の表現というよりも、時代と社会の表現となる。表現には、表現者と表現の場が不可欠だ。表現は、表現の場を伝播して、未来の表現者を生みだす。表現の場がなければ、わたしたちの未来もない。わたしたちの生活も、その一部は表現となり、表現の場を伝播して、わたしたちの未来を生みだす。

大竹伸朗展 2022/11/1-2023/2/5 東京国立近代美術館 筆者撮影

 

『スモール・ランダムパターンズ・アー・ビューティフル』

1   はじめに; 千個の難題と、千・千・千・千(ビリオン)個の可能性

1.1 個体差すなわち個体内変動と個体間変動が交絡した状態

1.2 組織の集合知は機械学習できるのか(前稿、第12回)

1.3      私たちは機械から学習できるのか – 太平洋

<羅針盤ヲ見ヨ>

<羅針盤ヲ見ヨ>

<滅亡を警告しあうわれわれに、これら絶望のほかに

希望といえるものはない>

<ブラウン管ヲ見ヨ>

<ブラウン管ヲ見ヨ>

<ブラウン管ヲ見ヨ>

『詩集<太平洋>』(太平洋、堀川正美、思潮社、現代詩文庫1970年)

個体差の機械学習が可能になると、場合によっては、気づきにくい個体差がうまく説明できるようになることで、個体差にともなう不確定性を個体ごとに最適化できるかもしれない。しかし、集団の個体差の場合は、合理的な説明や、最適化すること自体が問題になる。集団の個体差を機械学習する場合は、信頼ができて十分な量のデータが入手できない、もしくはデータが独占されているということもありうるだろう。個体差の機械学習は、専門的なデータ解析の技術なので、技術の進歩とその社会的影響を、ていねいに注意深く公開の場で議論しながらすすめれば、原子力発電や生命科学などの、社会的な影響が大きい先端技術よりは、取り扱いやすいように思われる。しかし、専門家には意識されない問題が、不可逆に進行しているかもしれない。データの時代が、情報化の範囲内における技術革新なのか、近代西洋文明とは異質の、文明論的な激動の時代と考えるのかということで、わたしたちの近未来のイメージが大きく変わる。テレビやスマホなどによる情報革命は、印刷技術や蒸気機関による産業革命の延長上であって、革命なき資本主義社会の技術革新だ。資本主義社会は市場経済だけではなく、技術革新も必要としている。しかし、資本主義社会が長く続いたわたしたちの時代は、地球規模で解決が困難な社会問題を多数かかえている。例えば、貧富の格差の拡大は、一国の中だけではなく、国家間の格差も含めると、持続可能とは思えないレベルに到達している。この生活レベルでの格差を、現在の経済理論や技術革新で、解決できるとは思えない。しかしもし、わたしたちが機械から学習することができるのならば、西洋文明の歴史にはありえない変化となり、文明論的な激動の時代となるかもしれない。

機械から学習するのは、個別の事例ではなく、個別の事例をどのように理解するのかという、合理的な説明であって、わたしたちが理解できない合理性なのだ。類似の状況は、量子力学で経験している。量子力学が正しいとすると、わたしたちにとっては不合理な状況になるけれども、実験事実は量子力学が正しいことを示している。量子力学が完全な物理理論ということではなくて、自然の性質として、特に確率が関係するような状況では、サイコロによる確率の合理的な解釈では理解できない、実験事実を受け入れる必要があるということだ。アインシュタインは「神はサイコロを振らない」といって量子力学を批判したけれども、わたしたちは神(すなわち自然)が振るサイコロについて、理解できていない。量子力学を学習するのは、数式の学習であって、機械から学習するわけではない。しかし、量子力学のように、データからは正しそうだと思えるような、個別の事例が網羅的に(首尾一貫して)与えられたとき、わたしたちが理解できなくても、何かを学習することができるのだろうか。

囲碁や将棋のようなゲームの世界では、機械学習プログラムが、プロ棋士よりも強いことが明らかになったので、プロ棋士は機械から学習している。学習しているうちに、直感的にプログラムの動作を理解できるようになるのだろう。人びとの直感が働くためには、最高のプロ棋士のレベルであって、しかも若いほうが有利なようだ。市場経済の個体差を解析するプログラムが、情報熱力学もしくはデータ熱力学の奥義を探索して、データをうまく説明する結果を見いだした場合、わたしたちはその結果から経済理論を構築することができるのだろうか。従来の統計学では、仮説が明確に定義された場合、データによって仮説を検証できると考えている。仮説を発見するための探索的なデータ解析は、多くの可能性を示唆しているのに過ぎない。わたしたちが機械から学習できることは、直感的に仮説を作り出すことなのだろう。機械から学習するのは容易ではないし、あまり楽しくもない。若い人たちが、機械から学習するモチベーションを高めること、社会的な問題解決に、問題を作りだしたり放置したりする経済活動よりも、大きなインセンティブが与えられるようにすること、機械から学習するための社会システムとしての課題はたくさんありそうだ。

「スモール・イズ・ビューティフル」な物語は、生活の必要性に直結する中間技術を推奨しているけれども、従来の経済学に代わる経済理論は提案していない。経済学が市場にだけ興味を持つのではなく、生活にも配慮すべきだという主張は、「スモール・ランダムパターンズ・アー・ビューティフル」な物語の出発点でもある。そして、人びとの生活をよりよいものとする経済学が、市場をよりよく理解できるようになることが到達地点となるだろう。金融危機を例外としないで、不均衡で不完全であったとしても、現実の市場を物理学的に再考することで、より責任のある市場(特に金融市場)をめざす経済物理学に期待したい(『市場は物理法則で動く―経済学は物理学によってどう生まれ変わるのか?』〈マーク・ブキャナン、白揚社、2015年〉)。確かに、金融商品やトレーダーたちは、理想気体のような個人主義者たちであって、カオス理論などの最新の物理学を応用しやすいのだろう。しかし、生活者でもある労働市場や、企業買収・企業合併・企業破綻(はたん)がありうる実体経済では、流動的な運動や、A+B→Cとなる化学変化がありうる。理想気体のような個人主義よりも、液体的な経済環境であるため、より化学的な、経済化学としてのアプローチが有望だろう。化学とはいっても、非平衡系の熱力学において、自由エネルギーとエントロピーの変化を議論するという意味では、物理的な基盤を共有していて、気体と液体の相変化も含めて、市場を理解しようという試みでもある。

市場を理解するということは、予測不能性も含めて理解するということで、市場で儲けることを全く意図していないことは言うまでもないだろう。しかし、市場の個体差を理解できるようになると、予測不能性も含めて、市場を最適化できるようになるかもしれない。何が市場にとって最適なのかという定義がわからないのだから、市場のある特性に注目する場合の適切な制御、もしくは制御可能性という程度の意味になる。全く直感的な議論でしかないけれども、わたしたちの生活にとって最も重要なことは「平和」な社会であって、平和な社会の市場と、平和ではない社会の市場の特性を発見したい。平和な社会の市場においては、「経済が自発的に廻っている」のに対して、平和ではない社会の市場においては、「経済が直線的に制御されている」という仮説について考えてみたい。後者は戦争経済における国家の役割として理解しやすい。前者は、生物の代謝回転からの連想で、生活を支える経済活動が持続可能な条件に相当するのだろう。金融市場において、異なる市場を廻って、リスクなしに儲けることを裁定取引というそうだ。裁定取引は自発的には発生しないし、自然に解消されてしまう。熱力学の法則に従えば、自発的に廻り続けるとすれば、仕事または熱のエネルギーが外部から供給されて、内部のエントロピー変化に対応する熱が外部に排出される必要がある。マクロ経済学の巨人、ケインズは政府の財政政策によって経済が廻ること、廻る回転数によって指数関数的に経済効果が高まることを見いだした。税金を熱のようなものと考えれば、エントロピー変化こそが、平和な市場が生み出す経済活動の実態であって、ミクロ経済学をより精密な理論とする可能性がある。資本主義社会が必要とする技術革新は、負のエントロピーとして理解すれば、その役割と経済効果を定量的に評価できるようになるかもしれない。自発的で平和的な経済活動を、データ分析によって政府が適切に調整できるようになれば、本当の意味で新しい資本主義の時代となる。政府の経済政策は調整役であって、経済主体は企業などの経済活動を行う組織であることに注意しよう。経済主体が限定された経済データから、自発的に進行する経済活動を、ある程度正確に予想できるようになること、経済主体が機械から学習して、自ら実験する。政府は公共的なデータを提供し、マクロな観点で税と財政による調整を行うとすれば、そのような精密な市場経済を実現する国家は、軍事力に依存した覇権国家ではなく、適切なサイズ(人口)の、適切な経済温度(過度にどん欲にならない)を機械から学習して、平和を希求する国家となるだろう。

--------------------------------------

『みんなで機械学習』は中小企業のビジネスに役立つデータ解析を、オープンソースの無料ソフトOrangeでみんなと学習します。技術的な内容は、「ニュース屋台村」にはコメントしないでください。「株式会社ふぇの」で、Orangeにフェノラーニングを実装する試みを開始しました(yukiharu.yamaguchi$$$phenolearning.com)。

コメント

コメントを残す