「おいしいデータの家庭料理」の構想(その2)
『みんなで機械学習』第75回

11月 26日 2025年 社会

LINEで送る
Pocket

山口行治(やまぐち・ゆきはる)

株式会社ふぇの代表取締役社長。独自に考案した個体差の機械学習法、フェノラーニング®のビジネス展開を、栃木県那須町で模索中。元PGRD (Pfizer Global R&D) Clinical Technologies, Director。ロンドン大学St.George’s Hospital Medical SchoolでPh.D取得(薬理学)。東京大学教養学部基礎科学科卒業。趣味は農作業。

前回第74回は、新シリーズの構想を、書籍にまとめることを想定した企画案として考えてみた。今回は、「ニュース屋台村」の読者の皆様を思い浮かべながら、筆者の過去記事の到達地点で、新シリーズ「おいしいデータの家庭料理」を展望してみたい。

筆者としては、近代合理主義哲学の巨大連山の峻峰(しゅんぽう)、ライプニッツの「モナドロジー」を、スピノザ経由で登山して、山頂ではないけれども、見通しの良い峠にたどりついた。近代文明の荒野の果てに、新たな「データ文明」の連山を眺めている。その連山の一つが、個体差の機械学習、フェノラーニング®であると見定めてから、まずは無事帰宅して、登山の仲間を探したい。

近代文明の荒野は、危険がいっぱいだ。「データ文明」の果実を先取りしながら、仲間の仲間を大切にして、目立たないけれども賢く危険を回避する戦略を、「おいしいデータの家庭料理」大作戦と命名してみた。

読者と一緒に夢みる近未来

プロスポーツの場合、多くのファンが作るエコシステムが不可欠だ。試合を応援するエネルギーが、試合を盛り上げるだけではなく、未来の選手たちも作り出している。技術も同じで、短期的な技術開発競争だけではなく、実際に技術を使う、多くの利用者のエコシステムが、長期的な技術の発展を支えている。

人工知能(AI)技術が、18世紀後半に始まる蒸気機関や機械技術による産業革命に匹敵する、大きな社会変革をもたらすことは確実だろう。しかし、現在のAI技術は、短期的な投資ビジネスだけで、長期的なエコシステムの構想がない。

産業革命では、国家による教育によって、エコシステムを作ってきた。AI革命では、機械学習のファンクラブが、エコシステムを作るという夢想が、新シリーズの物語だ。

国家による教育では、極端な個人主義になるか、全体主義になるのか、そのエコシステムの限界と末路が見えてきた。米国を代表として、社会が分断されているという議論が多いけれども、そもそも、民主主義は個人主義と相性が良いので、社会が分断されやすい。民主主義では、国家や社会は個人の集合体だと考えている。

多細胞生物を、単細胞生物の集合体だと考えることは、前世紀の科学でしかない。ごく例外的に、単細胞生物の集合体のように見える藻(そう)類も存在する。しかし、そもそも、細胞は藻類や菌類、ウイルスまで取り込んで、とても複雑な細胞内小器官の集合体として進化している。

集合という数学的な概念においても、集合の集合が集合になる集合だけを、集合と定義しようという提案がある。特別な数学者以外には、意味不明かもしれないけれども、集合という概念が、とても難しいということだけは確かだ。

機械学習(プロスポーツでも家庭料理でも同じ意味)の、ファンクラブがエコシステムを作るという視点を、行き過ぎた個人主義からの反省と冒険の物語として描きたい。

共同体幻想の復古趣味ではない。人びとは「まばらでゆらいで」いるけれども、人びとの集団(ファンクラブ、組織、社会、国家など)が作る「データ」が、複雑につながっている近未来のイメージだ。

読者にとっての希望と期待

機械学習のファンクラブに入会したら、何を期待できるのか、どのようなよいことがあるのだろうか。「データ」を好きになると、どのようなよいことがあるのだろうか。

多分、日常生活は、いやなことや不都合なことばかりで、よいことなどほとんどないので、ファンクラブで楽しもうとするのだろう。一方で、理解しがたい技術が生活環境に蔓延(まんえん)することを避けるためのデータ技術もありうる。組織の一員として働かないと、失業者かアーティストと見なされる社会ではなく、ファンクラブの一員として、社会にデータを提供することで、社会とつながる社会もありうるはずだ。仲間の仲間が仲間になるような仲間は、どのような仲間なのだろうか。

おいしい食事をしたいと思うことと、好きなことをしたいと思うことは、よく似ている。日常の中で、一緒においしく食事をするのは家族であり、家族と一緒に家庭料理を作る。一緒においしく食事をする家族の集まりでは、食事を楽しめる。好きなことで集まっている仲間は、好きなことが異なっているグループとも仲間になれる。

現代では、家族としての経験は、楽しいものだけではないだろう。多分、血族としての家族の経験は、縄文時代であっても、楽しいものだけではなかったと思う。だからこそ、一緒においしく食事をする仲間を、家族として再定義したい。家族と一緒に食事を楽しむために、家庭料理を作る。

政治や経済における個人主義が行き過ぎているとしても、社会制度としては後戻りはできない。弁護士は離婚訴訟で忙しいし、精神科医も様々なタイプの社会不適合に対処している。弁護士も精神科医も、犯罪などの古典的な問題だけではなく、たくさんの新しい問題に振り回されている。

新しい社会問題が爆発的に増加している現代では、専門家がすべての問題を解決できるわけではない。専門家が解決できない社会問題は、政治家が隠ぺいするか、金銭的な問題にすり替える程度のことしかできない。しかし解決策がありうるとすれば、データから学習する以外の方法は無いはずだ。データも爆発的に増加している。

機械学習のファンクラブでは、楽しく学習して、「データ」を好きになる仲間ができるはずだった。面倒な社会問題には関わりたくない。機械学習のファンクラブでは、楽しく地域のデータを、おいしい家庭料理にすることに集中しよう。地域のデータが、おいしい家庭料理に仕上がったら、特許を出願して、その技術を公開しよう。「おいしいデータの家庭料理」において、特許出願する場合は、特別仕様の、生成AIエージェントに任せるようにしたい。公開されたデータ技術を、社会問題に応用するのは、高額の賃金で働く専門家かもしれない。エコシステムとは、そのようなものだと思う。

◆AIはデータの学習が苦手

機械学習のファンクラブでは、機械学習について学ぶのだろうか。少なくとも、機械学習を楽しめる程度には、機械学習を学ぶ必要があるだろう。スポーツ観戦に必要な競技ルール程度のもので、審判員のような専門性は不必要だ。機械学習のファンクラブは、機械学習を楽しむことは当然として、「データ」を好きになることが活動の原点で、しかも活動の目標でもある。ラグビーのファンクラブに入会するのは、スポーツ好きで、入会するとスポーツ好きの仲間ができて、さらにスポーツを好きになるようなものだろう。

機械学習のファンクラブが特殊なのは、スタープレーヤーである大規模言語モデル(LLM)が、データの学習が苦手という、意外な弱点があることだ。このLLMの弱点を、ファンクラブがどのように補うのか、工夫することで、機械学習の意味や価値が大きく変わる。

LLMは言語の学習が得意で、言語にリンクした画像や音楽も学習できるようになった。しかし、より抽象的な、スプレッドシートの形をしたデータ行列は、大半が数字で、変数名も略記されている場合が多い。データ行列から、データ定義文書のひな形を作ることはできても、最終的には解析計画書とデータ定義文書の整合性をチェックする必要がある。データ定義文書と解析計画書があれば、データ行列からある程度自動的にデータ解析を行うことができる。データ行列から解析計画書を作成することは、試験計画書があったとしても、ほぼ不可能だ。試験計画書から解析計画書を作成して、実際に試験を実施してデータを取得する。このプロセスを逆行できないのは、熱力学のエントロピー増大の法則(または時間の矢)のようなもので、人知(AIも含めて)のレベルを超えた話だ。

表形式のデータ行列の場合、試験計画書などにしたがって適切に解析し、解析結果を言語で説明してから、LLMが学習することになる。現在は、LLM学習の前処理作業の全てを人間が行っている。適切に解析するのではなく、考えうる探索的解析をすべて行うのであれば、機械学習のプログラムが、LLM学習の前処理作業を行うことができるだろう。

データマネジメント業務では、データの品質管理の目的で、初等的な探索的解析を網羅的に行っている。すなわち、データマネジメント業務を自律的に行うAIエージェントができれば、LLM学習の前処理作業を自動化できることになる。

機械学習のファンクラブが、データマネジメント業務のファンクラブから発展する可能性に気がついているのは、本シリーズの読者など、ごく少数に過ぎない。筆者自身は、日本のデータマネジメント部門の初代責任者だった。世界的にもまれな、データマネジメント業務のファンであると自負している。

機械学習の学習において、公開されている地域や企業のデータを、LLMが経済的に学習できるようになり、AI回答において、学習されたデータが頻繁に引用される経済的な価値は膨大なものになるだろう。インターネットの検索で、検索の表示順位が高順位になるように工夫する技術以上のインパクトがあるはずだ。機械学習のファンクラブは、楽しみながら、地域活性化に貢献できる。

データのネットワークの結び目

人びとの集団(ファンクラブ、組織、社会、国家など)が作るデータが、複雑につながっている状況で、関係ネットワークに結び目ができることがある。結び目が大きくなると、ハブ空港や権力中枢のように機能して、効率が良いようだけれども、結び目の内側が特異点として不可視になり、内外のリスクに弱く、制御しにくい。恐竜化した社会システムの末路だ。

関係ネットワークが、まばらでゆらいでいる場合は、結び目ができにくい。結び目ができにくい状況で、ネットワークを監視して調整する、機能を分散した疑似的な中枢を構成できれば、恐竜化した結び目が崩壊したとしても、ネットワーク全体が崩壊しない、予防的なクッション作用のあるネットワークとなるだろう。

近代文明における学校教育システムは、個人の能力に、過剰な(実体を伴わない)意味や価値を付与している。しかし、学歴社会といっても、卒業後の人間的な関係のほうが、学科の成績よりも長期的な影響力がある。言語が唯一のコミュニケーションの手段である場合、特に個人主義が過剰になって、不特定多数の言語活動が交錯する社会(SNSなど)では、非言語表現が無意味になって、人びとは居場所を失い、社会は不安定化する。逆に考えて、近代的な学校教育では、非言語表現や非言語能力の教育はうまく機能していないので、非言語能力が重要な実務教育は、卒業後の課題となる。

筆者が、非言語表現や非言語能力の学校教育はうまく機能していない、と断言するのは、学校教育で数学が好きになることは期待されていないし、芸術やスポーツは、前近代的な徒弟関係が主役だからだ。非言語表現や非言語能力は、好きにならない限り、役に立たないし、向上もしない。

言語能力においては、100カ国語以上を見事に翻訳するLLMにかなわない。AIはすでに、司法試験に合格するレベルになっている。数学においても、大学の入学試験や数学オリンピックのような、試験問題への言語による回答では、AIは人びとの最高水準に達している。

非言語表現、特にデータによるコミュニケーションを行う社会では、近代文明における言語による統治の常識が通用しない。サイバーセキュリティーに本気で取り組むためには、法律概念としての「犯罪」から再考する必要がある。非公開の非言語表現に溢(あふ)れるインターネットの社会は、暗黒社会だ。暗号コードとなった金銭が、暗黒社会で暗躍している。

希望の無い悲劇が、新しい希望の出発点

筆者の文章は、無責任な夢物語か、現実逃避のように読まれるのだろうか。筆者としては、次世代に責任をもって考えているつもりだし、無責任な政治家に、怒りすら感じている。

具体的に述べよう。中国と喧嘩(けんか)して、現在では勝てるはずもないし、勝てるように準備してから、喧嘩するほうが良いという意見がある。筆者の見解では、2050年に中国は、世界最大の認知症大国となる。認知症の治療薬や診断方法は、中国社会の最大の弱点に対する、最強の経済安全保障なのだ。筆者のフェノラーニング®は、認知症の治療薬や診断方法を開発する経験から、その問題点を克服することが目的で考案している。中国の弱点を明確に認識して、戦略的に認知症治療に取り組むことは、軍備の増強よりも確実な安全保障戦略となる。

米国や先進諸国も含めて、社会の弱点は、労働を忌避する個人主義にある。産業革命時代のような、勤勉な社会を望んでいるわけではない。職業が組織化されて、組織化された労働だけが労働であるかのような社会において、労働者は個人として生活している。その社会的な矛盾に、社会制度も人びとも耐えられなくなっている。社会現象としては、ひきこもりかもしれないし、少子化かもしれない。

日本も、認知症やひきこもり・少子化の問題を抱えている。このような社会の弱点に目を向けて、乗り越えてゆく努力をしないで、軍事力や移民に頼るような、安易な政治的発想に未来は無いと言いたいだけだ。国家の安全保障政策としては成功しても、人類が絶滅する。

インターネットの暗黒社会も含めて、近代文明の荒野に希望はない。文学が機能していないので、悲劇ですらないのかもしれない。英国の文芸批評家、テリー・イーグルトン(1943年~)の『希望とは何か-オプティミズムぬきで語る』(岩波書店、2022年)は、現時点で最高峰からの、言語で語る希望だろう。しかし、筆者としては、非言語表現、特にデータの表現に、言語の制約を乗り越える可能性を見いだしたい。

産業革命時代の非言語表現は機械技術であり、物理学だった。熱力学は、「力」から「エネルギー」へと、物理学の主役を交代させた。しかし、言語表現の主役は「力」で止まってしまった。核エネルギーですら、「軍事力」と言いくるめられている。

エネルギーは、中国語では能源もしくは能量というそうだ。多分、「能」は「力」の積分形なのだろう。「力」は個別のものであっても、「能」は集合的・集団的な性質になる。

機械学習のファンクラブは、起源から集合的・集団的なもので、「群れ」に近い。「力」の段階で止まってしまった言語表現を、非言語表現の世界を探索しながら、統計的で場の概念を伴うエネルギーへと、言語表現全体を、より自然で現実的なものとする冒険の物語を構想している。

スピノザのエチカの結語、「すべて高貴なことは、困難であると同時に稀有(けう)である」はAIが簡単に回答する時代になった。しかし、AIの理解は教科書的でしかない。「高貴なこと」を最高善と解釈している。スピノザが本当に言いたかったことは、「人格神を否定すること」だったはずだ。スピノザは、神を、教会権力の「人格神」から開放することで、最高善がもたらされるという、とんでもないプログラムを考えていた。しかし人類は、いまだ人間中心主義の段階に止まっている。AI技術を、人間中心主義および言語中心主義から解放すること、それは、困難であると同時に稀有である。

ウィトゲンシュタインの「論理哲学論考」の結語、「語りえぬものについては、沈黙しなければならない」も、AIが解説してくれる。言語の限界についての言及はあるけれども、非言語表現としてのデータの世界が、沈黙に値するものかどうか、よりAI自身にとって重要な考察はない。

データの限界は、測定しえないものだろう。測定技術の発展で、測定されたデータが爆発的に増加している。測定されたデータの意味や価値が不明なことが大半だ。しかし、測定された対象が、測定者との関係において、測定結果を共有する場において、何かを表現していると仮定することがフェノラーニング®の出発点だ。筆者にとっての希望は、機械学習のファンクラブにおいて、「データ」を好きになることで見えてくる、未知の希望であって、楽観主義ではない。未知の希望は、冒険に近い。「おいしいデータの家庭料理」について、語りえぬものを雑談する、稀有な経験を読者の皆様と一緒に楽しむことで、未知の希望を近未来への冒険としたい。

アルパカのキャラクターで生成AI画像を学習中

※『みんなで機械学習』過去の関連記事は以下の通り

第75回「『おいしいデータの家庭料理』の構想(その1)」(2025年11月10日付)

https://www.newsyataimura.com/yamaguchi-158/#more-22795

--------------------------------------

『みんなで機械学習』は中小企業のビジネスに役立つデータ解析を、みんなと学習します。技術的な内容は、「ニュース屋台村」にはコメントしないでください。「株式会社ふぇの」で、フェノラーニング®を実装する試みを開始しました。

コメント

コメントを残す