ウイルスの知恵（反脆弱性）
『みんなで機械学習』第31回

11月 27日 2023年社会

山口行治（やまぐち・ゆきはる）

株式会社ふぇの代表取締役。独自に考案した機械学習法、フェノラーニング®のビジネス展開を模索している。元ファイザージャパン・臨床開発部門バイオメトリクス部長、Pfizer Global R&D, Clinical Technologies, Director。ダイセル化学工業株式会社、呉羽化学工業株式会社の研究開発部門で勤務。ロンドン大学St.George’s Hospital Medical SchoolでPh.D取得（薬理学）。東京大学教養学部基礎科学科卒業。中学時代から西洋哲学と現代美術にはまり、テニス部の活動を楽しんだ。冒険的なエッジを好むけれども、居心地の良いニッチの発見もそれなりに得意とする。趣味は農作業。日本科学技術ジャーナリスト会議会員。

◆制作ノート

英国の経済学者エルンスト・シューマッハー（1911～1977年）の「スモールイズビューティフル」における中間技術の提案を、「みんなの機械学習」として実現するため、「スモールランダムパターンズアービューティフル」という拙稿を連載している。前稿では、生活関連のデータから、まばらでゆらぐ多様性を読みとることを考えてみた。個体差を含むデータを収集する前に、データを収集する時間と空間を、適切に離散化することが重要だ。離散化という意味で、データを回すこと、予測しながら漸進（ぜんしん）して、予測誤差を評価するサイクルを回すこと、機械学習の実践と改良によって、生活の不確実性を無効化できること、などを議論した。「スモールランダムパターンズアービューティフル」は途中の画像以降なので、制作ノートに相当する前半部分は、飛ばし読みしてください。

「スモールランダムパターンズアービューティフル」のゴールは、結論を論理的に構築することではなく、生活のライフサイクルにおいて、データの世界との共存・共生・共進化に希望を実感することにある。近代的なモノの価値に従属する経済から、コト（サービスなど）の意味を重要視する経済への移行を時代背景として、近未来のデータサイエンステクノロジーアンドアート（データの世界）が、人類の文明論的な変革をもたらす夢物語を、少なくともディストピアとはしない、複数の探索路を切り開こうとしている。物語のゴールにおいては、意味が認知される以前の「データ」そのものが、みんなの機械学習によって、「言語」とは別の、文明の道具になるだろう。

◆スマホとクルマ

スマホは無線電話にインターネットを取り込んだ。クルマもEV（電気自動車）となって、AI（人工知能）を取り込むだろう。スマホとクルマは、最強の商品で、欲望の資本主義そのものだ。クスリはバイオを取り込んで、最強商品の仲間になるのだろうか。非合法ドラッグであれば、確かに過剰な欲望を生みだす。麻薬は、過去の歴史や戦争に大きな影響を与えたけれども、商品価値は、タバコ程度かもしれない。クスリとして、最強の商品となる可能性は、老化を防止するクスリだろう。

スマホとクルマの場合は、そのリスクは社会が負担した。しかし、クスリのリスクは、製薬企業が全面的に負担している。クスリの開発におけるデータの改ざんは、クルマのデータ改ざんとは、レベルが異なる厳しさで管理されている。非合法ドラッグの問題があるので、クスリは特別なのかもしれない。しかし、スマホやクルマでも、軍事技術になれば、ロケットでも戦車でも、非合法ではなくなる。毒ガスは、軍事技術としても非合法だ。少し考えると、クスリは、スマホやクルマとは異なる社会性が強い商品で、最強に規制された商品であることが解（わか）る。逆に、スマホやクルマも、クスリのように規制されるようになるのかもしれない。

バイオ技術を取り込む可能性があるのは、クスリには限らない。農業や食品、エネルギー産業など、可能性は大きいし、実際に技術開発も進んでいる。しかし、最強の商品には結実していない。最近は下火になっているけれども、ゲノム分析装置（次世代シークエンサー）は、筆者のようなデータ主義者にとって、最強の商品だ。例えば、環境ゲノムのような、膨大な量のゲノムデータを、機械学習する近未来は、スマホとクルマよりも、データを活用する可能性で優（まさ）っている。人びとの願望が、個人としての不老不死ではなく、集団としての安全安心な環境を望むのであれば、環境ゲノムが最強の商品となる可能性がある。ウイルスやバクテリアは、進化スピードにおいて、最強のインテリジェンスであり、環境ゲノムが、ウイルスやバクテリアのインテリジェンスを解読するのであれば、環境ゲノムが最強の商品となるだろう。風が運ぶウイルスやバクテリアは、隣国の軍事・経済・人びとの生活を含む環境を知り尽くしている。問題は、私たちが理解できないというだけのことだ。

◆論理は理解の助けにはならない。

機能性食品のプラセボ対照試験（臨床試験で治療薬とプラセボ〈偽薬〉で比較検討を行う試験）が問題であるという薬理学の論文を読んで、大きな違和感を覚えた。論文の趣旨としては、薬効が、プラセボ効果との足し算ではなく、どちらか大きいほうの効果が評価されている場合もあるので、プラセボ対照試験が適切ではない場合もある。薬理学的には、とても論理的で、正当な議論だ。問題の多いプラセボ対照試験が、機能性食品の承認条件となっているという指摘も、政策的に重要な指摘だ。しかし、承認申請に使われる、プラセボ対照試験の問題は、「統計学的」な問題であって、申請者と、承認者のどちらかが、十分な「統計学的」なリテラシー（実務能力）があれば、問題は起こらない。実際に、統計専門家の役割が明確になった医薬品の承認申請では、議論は多いけれども、いまだに無作為化プラセボ対照試験がゴールドスタンダード（黄金律）で、大きな問題とはされていない。単純に言うと、機能性食品のプラセボ対照試験の問題は、薬理学の問題ではなく、統計専門家の問題なのだ。論文著者の薬理学者は、論文における論理の破綻（はたん）には気がついていなし、薬理学専門家の多くの読者も、論理的な整合性ではなく、薬理学的な内容に興味がある。

同様の論理的な問題は、前節の「スマホとクルマ」でも多数指摘できる。最強の商品かどうかは、同じ市場で比較する必要があるのに、環境ゲノムはデータサービスであって、スマホとクルマとは明らかに異質な商品だ。しかも、社会的なデータサービスは、資本主義の枠内にすら収まらないかもしれない。論理的には破綻していても、先端的な技術が、特定の商品に取り込まれ、商品の価値と技術の進歩が相乗作用をもたらす、という論旨自体は、機械学習について考える一側面をとらえているはずだ。論理的に不完全な文章の場合、文章の論旨とは別の観点からは、違和感が残る。本稿では、残された違和感とともに、何度も出発点に戻って、個体差の機械学習が、未来への希望となるように、複数の探索路を廻（まわ）り続けている。

◆データマネジメントは、プログラムのデバッギング感覚で

文章であれば、論理的に不完全であっても、論旨は明確に伝わる場合がある。不完全なプログラムは、異常終了するか、いつまでも終了しない。筆者は、プログラム作成が仕事でもあり、1000行を超える大作に挑戦したこともある。コンピューターが実用化された初期からプログラム作成をしていて、コンピューター科学などの、プログラミングの方法論を学習する機会はなかった。プログラミングの最良の教科書は、プログラム自体で、特に、オペレーティングシステム（OS）のプログラムは、無駄がなく、完成度が高い。現在、オープンソースというプログラミングの方法論に結実したのは、当時のUNIXオペレーティングシステムのソースプログラムが、UNIX OSとともに配布されていたことが始まりだ。OSなどの、完成度の高いプログラムを読んで真似（まね）をしながら、自力でプログラムを作成した。欠陥のないプログラムを作成することは、ほぼ不可能だ。特に、初期は不完全なプログラムであっても、プログラムの動作を観察しながら、問題点を理解し、より多くの機能を追加してゆく。不完全なプログラムを、部分的に動作させることを、「デバッギング（バグ取り）作業」と呼んでいる。プログラマーの立場からは、デバッギングの機能が豊富で、ソースコードの例示が多いプログラム言語が好まれる。

データマネジメント業務は、データベースを作成するときに、データベースの構造を定義して、データを入力し、データの問題点を調べて、データベース全体の品質管理を行う。統計プログラミングの場合は、大型で複雑な構造のデータベースではなく、表形式の、比較的小型なデータセットを取り扱う場合が多い。臨床試験のデータは、データマネジメント部門が、品質管理したデータベースを作成して、データベースからデータセットをプログラムで出力して、統計解析部門に提供する。データの問題点を調べる機能も、データベースシステムに装備されているけれども、単純な機能しかなく、データマネジメント経験者の目視によるデータチェックが、不可欠となっている。ビッグデータの場合は、データの目視チェックは不可能なので、単純なプログラムによるデータチェックしかできず、不完全なデータを使って統計解析が行われていた。機械学習は、このデータチェック機能を飛躍的に高めることに成功した。

欠測値や外れ値を含む、不完全なデータは、全体の一部でしかない。たとえ、10％のデータ（データセットの行）に問題があったとしても、ランダムに50％のデータを抽出すれば、問題のあるデータを含まないデータセットを、多数作成することができる。例えば、データによって正常異常を判別する問題で、決定木（デシジョンツリー）という統計手法を、上記のランダムに作成された多数のデータセットを使って、統計的に評価する方法に、ランダムフォレストという洒落（しゃれ）た名前を付けたのが、初期の機械学習の成功事例だ。最近のAIブームに火をつけた、ディープラーニングという機械学習法は、データの記憶と解析を巨大なシステムで統合して、多数のパラメーターを部分的に調整することで、最適な解析結果となるように繰り返し計算する。画像データの特徴量を、データマネジメントしながら抽出するシステムとして成功し、最近では、文字データの意味を理解（したように思える文章を生成）したり、タンパク質の立体構造の予測にも成功したりした。しかし、ディープラーニングには、巨大で高速なコンピューターシステムが必要で、学習用のデータに含まれるセキュリティーや倫理的な問題への対処などが、規制の対象となっている。

個体差の機械学習を考えると、機械学習を、データマネジメントの観点で再考する必要性が明らかになる。個体差の機械学習は、ビッグデータとは相性が悪く、臨床試験のように、多数のスモールデータを総合評価することが望ましい。スモールデータであれば、データマネジメントの観点が重要になる。ところが、データマネジメントのためのプログラミング環境は不十分で、本稿の最初に戻ってしまう。ランダムフォレストなどの、初期の機械学習が実装されたのは、統計プログラム言語だった。教科書の説明なども、統計用語が多いために、機械学習は統計解析の発展としてとらえられていた。筆者が開発している個体差の機械学習、フェノラーニング®も、統計プログラム言語で実装している。しかし、統計プログラム言語を使う目的は、プログラムのデバッグがしやすいからだ。データマネジメントをプログラムすることは、例外データの発見と処理のためのプログラムを作成することで、想定していない例外的な状況に対応するために、プログラムの動作状態を常に監視する必要がある。すなわち、データマネジメントのためのプログラミング環境は、プログラミングというよりも、デバッギング機能が重要になる。この分野でも、生成AIが飛躍的な技術革新をもたらしている。コード生成AIだ。

◆コード生成AI

プログラムを作成するためには、プログラム言語を学習する必要があることは当然として、プログラム言語の学習には、プログラム言語で記載された、上質なソースコードを多数読むことが、最短で最良の方法だった。コード生成AIは、大量のソースコードを機械学習して、生成AIの機能で、プログラムコードを作成することができる。例えば、Github（ギットハブ）というオープンソースのデータベースを機械学習して、Github Copilotというコード生成AIサービスが実現されている。データマネジメントで汎用（はんよう）されるSQL言語やSAS言語では、いまだコード生成AIサービスはビジネスになっていないけれども、1～2年以内には、プログラム言語の支援機能として、実装されることになるだろう。便利な技術には、SF（サイエンスフィクション）のようなオバケが隠れていることもある。例えば、生成AIシステムのソースコードを学んで、新たな生成AIシステムのプログラムコードを作成できるとしたら、生成AIが自己増殖または進化することになるかもしれない。

おそらく、もっと必要性があって、現実的なAISFは、生成AIシステムのデバッギングを行うプログラムコードを、生成AIシステムのソースコードを学んでコード生成AIするシステムかもしれない。生成AIシステムを含めて、多くの機械学習・AIプログラムは、Python（パイソン）言語によってコーディングされている。PythonプログラムをデバッグするPythonプログラムを作成することは可能で、その場合、Python言語の仕様が拡張されたり、よりデバッグしやすい新言語が作られたりするだろう。その新言語で、生成AIシステムとそのデバッギングツールが開発されるとすれば、明らかに生成AIの技術的進化であって、しかも、技術的進化自体がシステムにコーディングされている。すでに、特定の分野では、人間の能力を超えてしまったAI技術が、自分自身のコードを生成するという、SFの世界に近づいている。しかし、筆者としてはコード生成AIの進化は、プログラマーの負担を減らす、限定的な効果しかないだろうと考えている。コンピューター言語は、自然言語とは大きく異なっていて、特定の使用目的のために、論理的に設計されている。コンピュータープログラムの表現力は、論理よりは可能性があっても、自然言語とは比べ物にならないほど限定されている。コンピュータープログラムの表現力では、数学研究の全ての可能性に、遠く及ばない。それでも、論理よりは、コンピュータープログラムのほうが、ビジネスに役立つはずだ。

◆弱さを迅速に理解することは、強みである

やっと本稿「4.6　弱い最適化－脆弱性/反脆弱性からのスタート」のスタート地点が見えてきた。ナシーム・ニコラス・タレブの反脆弱（はんぜいじゃく）性という新概念について、拙稿『週末農夫の剰余所与論』第28回「恐竜新時代から人類新時代へ」で言及してから、2年以上が経過している。本稿は、その続編ではないけれども、筆者の立ち位置は、より鮮明になっていて、反脆弱性を、個体近傍の小集団の「まばらでゆらぐ多様性」として実践しようとしている。すなわち、スタートとゴールはある程度見えているけれども、その間の探索路を、ぐるぐる廻っているのが現状だ。しかも、PDCA（Plan-Do-Check-Act）に機械学習を埋め込んで、高速に予測しながら、脆弱な小集団をマネジメントすることを試みている。

もっと具体的に考えてみよう。生活関連のデータサービスとして、脆弱な小集団として介護施設を想定して、大手企業のSOMPOケアのようなサービス（https://www.sompocare.com/rdp/）を、地域の中小介護施設が展開できるようにするデータサービスだ。大型の設備投資はできないけれども、SOMPOケアのサービスを研究して、介護者のスマホでできる範囲のサービスを工夫する。ビジネス関連のデータサービスでは、大企業向けのAI経済予測サービス（https://service.xenobrain.jp/mydata-forecast-option）の、地域中小企業版が考えられる。AIで予測するということ自体は、従来の情報サービスと大きな変化はない。機械学習の最大の特徴は、意味の解らないデータを使って予測モデルを作れるということで、PDCAサイクルのように、予測に基づいて介入して、その結果を予測モデルに反映することも可能になる。もちろん、意味が解らないのだから、うまくいかないことのほうが多いだろう。従来は探索的データ解析として、統計解析の専門家が行っていた解析業務を、機械学習によって、データを収集しながら、リアルタイムに解析を行う。ビッグデータと大企業の組み合わせで、ある程度成功しているビジネスモデルを研究すれば、弱小な小集団においても、AIデータサービスが可能になる。AI技術を応用しているので、成功すれば、少なくともビジネスモデル特許を出願できる。機械学習の方法や予測モデルに新規性と進歩性があれば、AI技術としての特許出願も夢ではない。手短に言えば、データサービスを次世代の成長産業とする提案だ。データサービスは、巨大で頑健なビジネスよりも、脆弱な生活とか中小企業のビジネスのほうが、効果的に活用できる。データ取得とデータ解析のコストは、機械を使えば、いくらでも合理化できる。脆弱な人びとと共感できて、問題を探るセンスが求められる。波に乗るサーフィンや、逆風をとらえるヨット、雲の先に空を見る、色即是空　空即是色の世界など、近未来のデータサービスは、身近な人びととともに、もっとセンシティブになってゆくだろう。

川の波　筆者撮影　　2023年10月6日

『スモールランダムパターンズアービューティフル』

1 はじめに; 千個の難題と、千×千×千×千（ビリオン）個の可能性

1.1　個体差すなわち個体内変動と個体間変動が交絡した状態

1.2 組織の集合知は機械学習できるのか

1.3　私たちは機械から学習できるのか

2 データにとっての技術と自然

2.1　アートからテクノロジーヘ

2.2　テクノロジーからサイエンスアンドテクノロジーへ

2.3　データサイエンステクノロジーアンドアート

2.4　データサイクル

2.5　データベクトル

2.6　局所かつ周辺のベクトル場としてのデータとシミュレーション

3　　機械学習の学習

3.1　解析用データベース

3.2　先回りした機械学習

3.3　職業からの自由と社会

3.4　認知機能の機械学習とデジタルセラピューティクス(DTx)

3.5　学習は境界領域の積分的探索－ニッチ＆エッジの学習理論

3.6　機械学習との学習

4　　機械学習との共存・共生・共進化－まばらでゆらぐ多様性

4.1　生活と経済の不確実性

4.2 生活と経済に関連する技術は、何を表現しているのか

4.3　スモールデータアプローチ－個体差のまばらでゆらぐ多様性

4.4 まばらでゆらぐ多様性の過去・現在・未来

4.5 生活の不確実性を予測する（前稿）

4.6　弱い最適化－脆弱性/反脆弱性からのスタート（本稿）

人間中心ではない世界を考えることはたやすい。中心がない世界を考えればよい。もしくは、中心はブラックホールのような特異点で、外部からは理解できないと仮定すれば、理解できない中心の周辺で、積分的な思考を行えば、あえて内部を理解する必要はなくなる。積分的な思考とは、データを測定して、コード化する、データの世界と相性が良い。データは、コード化されることで、意味が付与されて、理解可能になる。データを測定する際には、測定する時間と場所を適切に離散化して、データが表現している「まばらでゆらぐ多様性」が、データを集積した後にも再現可能にする工夫をしよう。中心がないデータの世界を、正確に再現することは難しい。しかし、生成AIのように、ランダムに再現して、興味深い事例を抽出すれば、その模擬的な世界の中でコード化して、模擬的に理解可能になるかもしれない。機械学習とともに学習するときには、人びとの「興味」が理解を作り出す。論理はあまり役立たない、もしくは、論理は機械学習にすでに組み込まれていると考えるほうが良いだろう。個体差の機械学習、もしくはデータマネジメントのプログラミングにおいては、人びとの「興味」は、プログラムのデバッギング（バグ取り）のことだといえば、よほど偏向した興味といわざるを得ない。それでも「みんなで機械学習」して、近未来のデータサービスをたくさん作りだして、興味深い成長産業とすることを提案しているのだから、雲をつかむような話だ。

最速で、前稿から本稿までの要旨をまとめてみた。まばらでゆらぐ多様性を、人間中心ではなく、人びとが近未来まで生存する、生活やビジネスの指標とするのであれば、生活やビジネスの問題を解決する場合にも、強い最適解をめざさないほうが良いことになる。強い最適解を、とりあえず、最適であることが検証された解として理解しておこう。そうすると、弱い最適解は、大局的には最適ではないかもしれない、十分には検証されていないかもしれない、問題を完全には解決できないかもしれない、不完全な解決案ということになる。しかし重要なことは、強い最適解を発見して多くの人びとが納得するのには時間がかかり、弱い最適解であれば、少数の人びとが素早く試すことができることだ。弱い最適解を実行するためには、まばらでゆらぐ多様性に富んだ社会が望ましく、多様性が失われている現代社会では、強い最適解しか受け入れられないとすれば、分水嶺（ぶんすいれい）を超えてしまうと、高望みの最適解を求めて、破局に向かうしかないということなのだろうか。

不確実性が増大している現代の生活・経済・社会・政治においては、そもそも、解決策よりも問題やリスクの発生が上回っていて、戦争などの破局的な状況も日常の一部になっている。まずは、生活や経済の予測性を向上させて、社会や政治の不確実性の増大に、ブレーキをかける必要がある。予測性が向上しても、必ずしも解決策につながるとは限らない。しかし、予測ができれば、リスクを回避すること（早く逃げる）が、弱い最適解になるかもしれない。米国の辛辣（しんらつ）な思想家、ナシーム・ニコラス・タレブの、反脆弱性という新概念を紹介する記事（※参照1）を書いてから2年ほど、反脆弱性は、機械学習の社会的な有用性を考える、大きなヒントになっている。反脆弱性は、不確実性を巧みに利用して、したたかに生き延びたり、ビジネスで儲けたりする戦略だ。機械学習による予測は、リアルタイムにリスクの予兆を検出するので、反脆弱性に役立つ。反脆弱性は、多くの場合、常識にとらわれない斬新なアイデアであるため、機械学習した結果を、生成AIでブレインストーミングすることも、反脆弱性に役立つ。反脆弱性を有効に実現するためには、個人よりも小集団のほうが有利な場合もある。タレブは個人主義者であるため、集団的な反脆弱性は見逃されているけれども、生物集団ではの社会的行動では、例えばミツバチが、集団の体温でスズメバチを殺害する、多数のイワシが高速に旋回して巨大な柱になるなど、よくある反脆弱性だ。小集団で機械学習することの反脆弱性は、本論の主題であり、スモール・ランダムパターンズ・アー・ビューティフルの出発点だ。筆者は、分水嶺は技術によってシフトすると考えているので、個人および小集団における問題やリスクを、機械学習による弱最適解によって解決する技術的試みが成功すれば、個人および小集団でまばらでゆらぐ多様性が回復して、そのような反脆弱性を実現した個人や小集団、もしくは社会が生き延びる可能性に、未来への希望を見いだしている。

生成AI（Generative AI; GAI）が画像や文章を生成すると、生成AIがビジネスにとってワープロ以上のインパクトがあることを、人びとは直感的に理解した。日常的なビジネスにとって、不必要になるのは、洗練されたタイピストではなく、専門的な知的労働者だ。生成AI、特にチャットGPTの技術的な解説は多数あるし、現在進行形の技術だけれども、筆者なりに、大胆に生成AIの本質を考えてみよう。データを機械学習すると、データの意味が見いだしやすくなる。データマネジメントによる例外データの処理と、探索的データ解析が統合されて、プログラムによる自動的なデータ処理の結果に、計画時に想定していた、もしくは想定していなかった意味を見いだすことになる。しかし、データの世界での意味は、言語の意味のように直観的なものではなく、数式でしかない。生成AIでは、さらに一歩進めて、機械学習の結果を、シミュレーションによって、データの世界から言語（またはイメージ）の世界に戻して、再構成する。データの機械学習が適切であれば、ランダムにデータをシミュレーションした結果から、明らかに無意味な結果を除外することができる。探索的データ解析を、データの世界ではなく、模擬的に生成された言語やイメージの世界で行えるため、人間にとっては都合がよい。コンピュータープログラムを生成することも可能であるため、人間がデータや機械に追従する必要もなくなる。生成AIは、素晴らしい技術革新であることは確かだけれども、あくまで、ビジネスなどの、人間中心の世界での技術的な問題解決に過ぎない。例えば、機械学習による生活や経済の予測を行う場合、生成AIによって、予測結果を数値ではなく、グラフ表現したとしても、予測精度は人間が判定するのではなく、データから推定される。アートやビジネス以外では、意味不明なデータの世界を探索する必要性は多い。生成AIは、新しいメディアとして機能することが想定されるので、メディアの運営に関する内部統制と、外部チェックを、SNSの時代よりも強化して、医薬品のように、国家機関による承認と査察を行う、社会システムの構築が急がれる。

生成AIはディープラーニングという機械学習技術を使っている。個体差の機械学習を実装するフェノラーニング®を使っても、生成AIのようなシミュレーションを実現することもできるだろう。言語の学習のような、大規模な学習はディープラーニングで行い、個体近傍のスモールデータの機械学習はフェノラーニング®で行って、その結果をディープラーニングの生成AIで表現するなどの工夫も可能だ。ビジネスのPDCA（Plan-Do-Check-Analysis）サイクルを、AI技術で半周先行して、CAPDサイクルとする提案が、『みんなで機械学習』の第1回記事だった（※参照2）。生成AIがビジネスを変革することが確実になった現在から再考すると、CAPDサイクルというよりも、STPD（See-Think-Plan-Do）サイクルと言い換えるほうが分かりやすい。筆者は何十年も前に、英国で運転免許を取得したのだけれども、その時にSee-Think-Plan-Doを教えてもらった。角を曲がるとき、車線変更するとき、Seeから始めて、アクションは最後で、アクションの後には、新たな視界でのSeeが始まる。ビジネスにとってのSeeを生成AIが作成し、人びとがビジネス機会を考えて、生成AIが模擬実行してから、人びとがToDoリストを作って実行するというサイクルだ。運転やビジネスにとって重要なことは、ある状況を認識したら、その状況認識が変化しないうちに実行して、新たな状況を作り出し、過去のことは忘れることだろう。新しい状況に集中するために、意識的にリセットする。本論は、日本の中小企業で機械学習を使ったビジネスを推進することが主テーマであるため、PDCAサイクルについて考えているけれども、AI技術との共存・共生・共進化という意味では、生活環境から社会政治環境まで、AI技術とは無縁の未来を考えるほうが難しい。多少の失敗が許されるビジネスが先行して、文明全体が過剰な生産と消費の指数関数的な爆発から脱却して、重層的に折り畳まれる近未来を模索しよう。

多くの人びとが生活していて、多種多様な商品とサービスが市場経済を動かしている。多くの人びとが、スマホやクルマと共に生活する今日では、自然発生的な市場経済ではなく、不確実性が増大した政治的マクロ経済となっている。政府も投資や投機を行っている。軍事経済は、戦争をやってみないと損得がわからないという意味で、典型的な投機だろう。それでも、スマホやクルマの技術は、最先端の軍事技術でもある。バイオ技術も最先端の科学技術だけれども、軍事応用は厳しく制限されている。軍事技術だけではなく、クスリや食品への応用も、規制の対象だ。このバイオ技術で、国家どころか国際チームに挑戦した異端者、クレイグ・ベンター（米国の分子生物学者）について紹介した4年前の記事を思い出した（参照3：「ゲノムの中に遺伝子が2万5千個程度しかないことに驚愕（きょうがく）して、これからは環境ゲノム（メタゲノムのこと）だと負け惜しみを言ったことが伝説になっている」）。ヒトゲノムの中に、多数のウイルスまたはその断片のコピーが潜んでいる。環境ゲノムとしても、環境中ウイルスの網羅的解析（バイローム）が発展している（※参考資料1）。ウイルスは宿主となるヒトや細菌などの生物の多様性と比較にならないほど多様で、ウイルスゲノムの同定や系統分類自体が困難な課題になる。個体差の機械学習、フェノラーニング®を、バイロームに応用すると、生活・経済・社会・政治のオルタナティブデータとなるのではないか、ウイルスは地球環境の全てを知っていて、ウイルスデータを機械学習して、その意味を解読する夢物語だ。クレイグ・ベンターも、その後の科学者たちも、近未来の機械学習のことまでは考えていない。タンパク質の立体構造予測という難問を解いたディープラーニング技術（アルファフォールド）の次は、環境中ウイルスの網羅的解析（バイローム）の難問かもしれない。ウイルスの知恵（反脆弱性）を解読できれば、新しい文明が見えてくるだろう。ウイルスの知恵（反脆弱性）は、スマホやクルマとは比較にならないほど刺激的で、エキサイティングなサービス商品を、多種多様に生み出すかもしれない。ウイルスの知恵（反脆弱性）は、人類の知恵を上回っていることは確実なので、商品開発に失敗すれば、本当の「死の谷」になるリスクも覚悟しておこう。

◆次回以降の予定

4.7 ひとつのビッグ予測、たくさんのスモール適応

5　　自発的な小組織（seif-motivated small organizations）

※過去の関連記事は以下の通り

参照1：『週末農夫の剰余所与論』第28回「恐竜新時代から人類新時代へ」（2022年5月4日付）
https://www.newsyataimura.com/yamaguchi-71/

参照2：『みんなで機械学習』第1回「CAPDサイクルの4回転半がゴール」（2021年2月16日付）

https://www.newsyataimura.com/yamaguchi-40/

参照3：『住まいのデータを回す』第16回「ウイルス・人工知能・人類の共存・共生・共進化：データエチカ（１）」（2019年1月15日付）

https://www.newsyataimura.com/yamaguchi-104/#more-7916

※参考資料1：

https://www.jstage.jst.go.jp/article/jsbibr/4/2/4_jsbibr.2023.primer5/_html/-char/ja

－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－

『みんなで機械学習』は中小企業のビジネスに役立つデータ解析を、みんなと学習します。技術的な内容は、「ニュース屋台村」にはコメントしないでください。「株式会社ふぇの」で、フェノラーニング®を実装する試みを開始しました（yukiharu.yamaguchi$$$phenolearning.com）。

Tags: みんなで機械学習

One response so far

リスク適応的マネジメント『みんなで機械学習』第46回 | ニュース屋台村より:

03/09/2024 5:01 AM

[…] https://www.newsyataimura.com/yamaguchi-105/ […]

Reply

ウイルスの知恵（反脆弱性）
『みんなで機械学習』第31回

山口行治（やまぐち・ゆきはる）

コメントを残すコメントをキャンセル

カレンダー

最近の投稿

最近のコメント

カテゴリー

2026年7月
月	火	水	木	金	土	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

ウイルスの知恵（反脆弱性）『みんなで機械学習』第31回

山口行治（やまぐち・ゆきはる）

コメントを残す コメントをキャンセル

カレンダー

最近の投稿

最近のコメント

カテゴリー

ニュースネットクラウド

ウイルスの知恵（反脆弱性）
『みんなで機械学習』第31回

コメントを残すコメントをキャンセル