山口行治(やまぐち・ゆきはる)
株式会社ふぇの代表取締役。独自に考案した個体差の機械学習法、フェノラーニング®のビジネス展開を、栃木県那須町で模索中。元PGRD (Pfizer Global R&D) Clinical Technologies, Director。ロンドン大学St.George’s Hospital Medical SchoolでPh.D取得(薬理学)。東京大学教養学部基礎科学科卒業。趣味は農作業。
1.1 おいしいデータは栄養たっぷり
AI(人工知能)幻想の中で、のんびり生きるアルパカキャラの仲間たち。しかし、AIビジネスはデータを食べて急成長している。インターネットに公開されている言語データは、ほぼ食べ尽くされて、都会的なLLM(大規模言語モデル)の摩天楼(まてんろう)ができ上がった。
アルパカキャラが食べるデータは、数字のデータで、ほとんど意味不明だけれども、栄養はたっぷりある。おいしい食べ方を工夫して、注意深く、仲間の人びととAI技術を先回りしよう。
◆AIビジネスの荒野
人間の社会は、AIビジネスに言語データを食べ尽くされて、荒廃してしまった。人間社会の荒野で、恐竜のように狩りをする独裁者たち。百億人の人間を、軍事力や経済力という、力(ちから)で支配する独裁者たち。強力な科学技術を使って、独裁者が支配する組織によって、世界をコントロールしようとしている。科学技術の使い方を誤って、社会や自然環境を破壊している。恐竜化した組織の利益を最優先するAIビジネスでは、巨大な政治的・経済的リスクを予測することも、回避することもできない。
独裁者がいなくなれば、AIビジネスが善良になるという、楽観的な思考停止は時間の無駄だ。独裁者が悪いのではなく、近代文明終末期の荒野において、独裁者は現実であり、自国経済を維持するために、破壊力を競っている。AIビジネスにおけるLLMの摩天楼は、言語によって作り出された架空の構造物であって、その構造物が廃墟に見えるのは、アルパカキャラと一緒に、未来から見た蜃気楼(しんきろう)なのだろう。
AI幻想によって生まれたアルパカキャラたちは、古典的な力学モデルに潜んだリスクを察知する能力がある。力(ちから)で勝っても、リスクには弱い。最先端の科学技術に仕組まれた、量子力学や統計力学は、巨大なエネルギーを制御する超難解な理論だ。アルパカキャラたちに、難しい数学を理解する能力は、もちろんない。しかし、アルパカキャラは、意味不明なデータを食べて、おいしくないデータを感じる能力がある。物理学の理論は難しくても、データを食べ続ければ、生き延びているうちに、リスクが少ないおいしいデータを、経験と本能が教えてくれるようになる。
本稿の筆者(フェノじい)は、人間社会の未来に悲観的だ。しかし、日本社会の未来は、あまり悲観していない。近代文明の終末期において、長い経済停滞や、環境破壊を生き延びるのは、肉食恐竜がうろつく大陸ではなく、周辺の島国だと考えている。
◆フェナの学習ノート
左が前稿のフェナ、右は最近の姿。少しアルパカらしくなって、成長したかな。

経済の話は難しくて、よくわからないのよね。もしも勉強してわかったような気になっても、私とはあまり関係ないと思うわけ。しかし、経済は私たちアルパカにとっても大切で、大きな影響があるのよ。那須町のアルパカ牧場は、閉鎖になってしまったでしょ。だから、経済をAIに学習してもらえないかしら。
経済のAI予測が実現してから、見通しの良い経済を、やさしく私たちに教えてもらいたいものだわ。でも、AIでは、気ままな私の行動を予測できないように、多分、経済も予測できないでしょう。株価を予測できるようになれば、予測できない人びとは、株を買わなくなるだけ。
経済を予測できなくても、経済をコントロールすることはできるのかしら。政治家たちの言うことは、あまり信用できないけど。フェニィやフェノじいが考えているみたいに、どのような経済環境でも、生き延びることは大切だと思う。だけど、フェニィやフェノじいでは、生き延びても、子供たちを作れないじゃない。
子供たちの未来を予測することはできなくても、私たちも、親や仲間たちに見守られて育ってきた。経済だって、どうせよくわからないのだけれど、見守ってゆくことはできそうだわ。フェニィやフェノじいは、そういうことが言いたいのかしら。
◆個体差って何だろう
本稿に至るまでの、道のりは長かった。フェノじいが若かった頃、物理学が全盛期だった。光にも重力にも個体差は無い。物理現象の差異は、時間や空間の性質で説明できていた。生物学の個体差も、遺伝子の差異で説明できるかもしれない。しかし、化学では、個体差というよりも、不均質な物質や、混合物の性質が、要素還元的には予測できない、複雑系であることが明らかになってきた。生命も、典型的な複雑系だ。
私たちとは縁遠い理科の話ではなく、身近な人びとに個体差があることは疑いようがない。医薬品の、薬効の個体差の場合はどうだろうか。理科なのか心理学なのか。経済学も大切だ。
個体差は、個体の差異なのだから、個体として誕生してから消滅するまでの、そして新たな個体を産出する、ライフサイクルの差異であることは確実だ。人間であれば、年齢と性別が、ライフサイクルの主要な変量になる。会社のような組織であっても、創立から消滅まで、社員数や資産が、ライフサイクルの主要な変量となる。人工的に細胞を脱分化させるiPS細胞の実験からの推測で、ライフサイクルに関与する主要な因子は、3つから5つ、すなわちライフサイクルに起因する個体差は、3次元から5次元の現象と思われる。2つ程度の因子はすぐに分かるので、現象ごとに、1つから3つの、自明ではない因子を探索することになる。
個体は、ライフサイクルを共有する個体群の中で、個体であることを「表現」している。その個体の表現空間が、3次元から5次元と言い換えてみよう。個体としての表現は、「場所」の表現に集約される。異なる場所の個体は、異なる個体として識別される。しかし、個体にとって「場所」の意味は、個体群によって全く異なるだろう。この「場所」の表現を、いかに読み解くのかということが、個体差を理解するための、個体の表現空間の中心課題となる。
医薬品の薬効の個体差に関する実務経験から生まれたフェノラーニング®は、個体差に関与する因子を、データから推定する方法を模索している。例えば、性別や年齢であれば、臨床検査値からかなりの精度で推定できる。MRI(磁気共鳴画像法)であれば、戸籍の情報よりも正確に、医学的に意味のある性別や年齢を推定できる。
多変数のデータ(独立変数)から、教師データ(従属変数)を推論するのは、通常の多変量回帰分析で、変数の選択方法も、それなりに工夫されている。しかし、多変量解析の実務は、試行錯誤で、応用範囲も限られている。もし、たくさんの個体のデータがあれば、ビックデータ解析における機械学習の方法が応用できて、通常の多変量回帰分析よりも、はるかに優れた精度で、しかも計算機が網羅的に試行錯誤をしてくれる。人間が1週間かかる探索的なデータ解析であっても、機械学習では10分程度だろうか。実感として、1000倍は計算速度が速い。
そうはいっても、ビッグデータ解析では、統計解析統計解析の100倍以上の、大量のデータを必要とするので、経済効率は限定的で、やはり応用範囲が限られてしまう。
フェノラーニング®は、個体差に関する仮定(モデル)を使うことで、実際のデータの100倍以上の大量のデータを、計算機シミュレーションによって生成する機械学習法であるため、個体差を理解してモデル化することが最重要になる。特許出願前なので、技術的な話はこの程度にしておこう。
◆場所の個体差
ライフサイクルに起因する個体差は分かりやすいし、フェノラーニング®も、実際の臨床試験のデータで、ある程度検証できた。しかし、場所の個体差は難問だった。現在のフェノラーニング®は、性別や年齢など、ほぼ自明な要因以外は、事例ごとに、探索的に個体差に関連する要因を解析している。製薬企業における医薬品の開発では、薬効の個体差に関連する要因を、「バイオマーカー」(※参考1)という場合もある。「バイオマーカー」の開発には、医薬品の開発に相当する費用が必要になるので、応用範囲が限定的で、新薬開発の救世主とはならなかった。「バイオマーカー」の個体差が問題となって、ぐるぐる回りの議論となり、議論の出発点と目標を明確にする必要があった。25年ほど前の話で、フェノラーニング®は、その時の議論が土台になっている。
医薬品の薬効に関連した個体差では、性別や年齢などの、ほぼ自明な個体差に関連する要因以外は、多分、医学的には、少なくとも西洋医学の枠組みでは、大きな進展が望めそうになかった。例えば、臨床診断と病理診断の不整合など、患者さんの個体差以前の問題が大きいのだけれども、西洋医学の体系は、歴史的な意味での硬直性と、臨床の実務の重圧で、変化を受け入れる余地が小さい。MRIなどの、最新の画像診断技術を使った、放射線科による診断が、臨床診断と病理診断の仲介をするようになる期待感はあった。そこで、イメージングバイオマーカーを開発したのだけれども、ガン治療薬以外の分野では、個体差のぐるぐる回りの議論になった。医師の主観的(経験的)な判断が不可欠で、西洋医学では、患者の個体差よりも、医師(医療機関)の個体差のほうが、医薬品の薬効の大きな要因になっている。
医療機関の個体差を、「場所」の個体差と考える場合、その場所を、どのようなデータから推定するのかということが問題になる。栄養状態のデータ、衛生データのデータ、そして経済状態や教育程度のデータから、医療機関の「場所」を推定することは可能だろう。しかし、そのようなアプローチは、少なくとも筆者が知りうる範囲で、製薬企業においても、国家の規制当局においても、表面的には解析の対象外とされる。臨床試験における医療機関の選定は、担当者の経験と直感で、主観的に最適化されていた。筆者のようなデータ主義では、多数の医療機関のデータを収集して、無作為化されたデータとして、医師(医療機関)の個体差を打ち消す(バランスをとる)ことが精いっぱいだった。
医学の実務的な束縛を離れて25年が経過した。この「場所」の個体差に関して、大胆かつ画期的な「仮説」を思いついた。「場所」の個体差は、局所的だけれどもくりこみが可能で、統計力学の揺動散逸定理、または「ランジュバン方程式をモデルとするデータによって表現されている」という仮説だ。
医薬品の薬効における医療機関の影響を、栄養状態のデータ、衛生データのデータ、そして経済状態や教育程度のデータなどからから推定するのではなく、実際に得られた患者さんのデータから、直接的に、「場所」の個体差を、個体ごとの揺動(ゆらぎ)と、場所をマクロに見た散逸構造の関係としてとらえようという試みだ。
この仮説の意味を考えることが、前回のデータ論「スモール ランダム パターンズ アー ビューティフル」を本格的に推敲(すいこう)する動機になっている。あまりにも難しい課題なので、アルパカキャラたちと共に、できるだけやさしく、実際の応用を夢みながら、前進してゆきたい。
◆不確実な時代と「反脆弱性」
わたしたちが生活しているこの時代は、不確実性が増大している。かつて確実だと思われたことが、ことごとく不確実であることが明らかとなり、不確実な出来事の影響が増大している。『「不確実性」超入門』(田渕直也、日経ビジネス人文庫、2021年)は、ビジネスの視点から不確実性が増大している時代を俯瞰(ふかん)している。量子力学や複雑系の理論は入門的で、「確率」の主観性や客観性については、ビジネスにとって意味のある無難な範囲での議論をうまくまとめている。
ナシーム・ニコラス・タレブは、『「反脆弱性」不確実な世界を生き延びる唯一の考え方』(ダイヤモンド社、2017年)において、不確実な予測にもとづいた頑健なシステムに依存するよりも、現状が脆弱(ぜいじゃく)であることを認識して、ランダムな変動と共に生きること(反脆弱性)を推奨している。
わたしたち日本人にとっては、津波への対処は、頑健な堤防を造るよりも、日ごろの避難訓練のほうが効果的だ、というと分かりやすいだろう。原子力発電所の反脆弱性を考えると、非常用電源を、安全な場所に確保することが大切であることに気がつく。タレブの議論は、金融業界のトレーダーとしての実務経験を、哲学的に反省したもので、効果的にデータを取得して機械学習する時代を先取りしている。
エルンスト・シューマッハの『スモール・イズ・ビューティフル』(講談社学術文庫 730、1986年)では、巨大技術や先端技術の危険性を先見し、自足生活のための中間技術を推進することが主張されていた。わたしたちの物語では、個体差に関連したデータによる機械学習が、地球レベルでの自足生活のための中間技術を実現すると仮定している。しかし、とても危険なAIビジネスもあり得るので、台風雲のような危険な未来も想定して、当面の生存を確保することの大切さも忘れないようにしたい。
◆フェノじいの寝言
移動する群れの中では、自分がいる場所の「位相」を無意識に察知している。例えば、先頭から6番目とか。イワシは、大量の群れで、しかも高速に回転していても、柱の形を維持できる。場所を、他の個体からの距離ではなく、角度や位相として感知することは、群れの統計的な性質に関係していそうだ。
攻撃的な動物は、単独で行動して、獲物との距離を感知する。弱い獲物たちは群れで行動して、仲間を位相で感知する。
身体の細胞たちにも、位相を感知する能力があるのだろうか。神経細胞は、脳波の位相を感知しているのかよくわからないとしても、少なくとも、神経細胞のネットワークが、脳波の位相を作り出していると思われる。
場所を位相で感知する(表現する)ということは、場(場所の関数)を複素数で表現することにほかならない。複素数で表現される場は、電磁場など、場の物理学の常識でもある。
位相を感じるためには、位相を合わせる(同調する)必要がある。そして、自発的に位相が揺らいでゆくと、驚くべき現象が現れる。集団の統計的な性質が、空間的なパターン(スペクトル)になって現れる。
筆者は、50年ほど前、核磁気共鳴(NMR)の実験で、核磁気の位相を制御して出現する、スピンエコーを実際に観察して、量子力学が現実のものであることを実感した。MRIは、このNMRの原理で、体内の水の性質を画像にしている。
非平衡熱力学の散逸構造も、自然の驚異と独創性に満ちている。生物の場所の個体差においても、位相を合わせることができれば、具体的なデータにおける、特徴的なパターンが観察できるかもしれない。
位相の制御は、デジタル技術で、ゆらいでいる現象を、はるかに高速に測定できるようになったので、いろいろ工夫ができそうだ……
※参考1:山口行治、新薬開発におけるバイオマーカー活用の現状、日薬理誌(Folia Pharmacol. Jpn.)131.435-440 (2008)
【目次案】「おいしいデータの家庭料理」
1 はじめに; データをおいしくする家庭料理
1.1 おいしいデータは栄養たっぷり<本稿>
1.2 地域のデータをおいしくする
1.3 データの学習と食事
2 データの料理法
2.1 生データのしたごしらえ
2.2 データは発酵するのか
2.3 データの調理器具
2.4 データの献立表
2.5 データのフルコース
2.6 おいしいデータは、地域と人びとを健康にする
3 機械学習の学習
3.1 データをおいしく下処理してから機械学習する
3.2 機械と一緒にデータを学習する
3.3 機械と一緒にデータを使うビジネスを考える
3.4 楽しくデータの学習をする
3.5 データの学習は冒険でもある
3.6 機械と一緒にデータを使うビジネスの冒険をする
4 まばらでゆらぐデータの家庭料理
4.1 まばらでゆらぐ生活と経済のデータ
4.2 生活と経済を豊かにするデータの家庭料理
4.3 まばらでゆらぐデータの調理法
4.4 まばらでゆらぐデータで健康になる
4.5 データを使った生活と経済の予測
4.6 生活と経済のリスクを生き延びる
4.7 たくさんの小さな試行錯誤による適応
5 よりあいグループと社会
5.1 よりあいグループ(地域や家族)のデータ
5.2 よりあいグループのよりあいグループ
5.3 機械と学習するよりあいグループのデータ
5.4 よりあいグループのデータは廻る
5.5 よりあいグループのデータの周辺
5.6 よりあいグループのデータを予測する
5.7 よりあいグループのデータで社会問題を解決する
6 おわりに;生活と社会の近未来
6.1 ほとんど色即是空・空即是色な(まばらでゆらぐ)世界
6.2 まばらでゆらぐ人びとの地域社会
6.4 データでつながる、地域のNPOから国際NGO連合まで
--------------------------------------
『みんなで機械学習』は中小企業のビジネスに役立つデータ解析を、みんなと学習します。技術的な内容は、「ニュース屋台村」にはコメントしないでください。「株式会社ふぇの」で、フェノラーニング®を実装する試みを開始しました。











コメントを残す