山口行治(やまぐち・ゆきはる)
株式会社ふぇの代表取締役。独自に考案した個体差の機械学習法、フェノラーニング®のビジネス展開を、栃木県那須町で模索中。元PGRD (Pfizer Global R&D) Clinical Technologies, Director。ロンドン大学St.George’s Hospital Medical SchoolでPh.D取得(薬理学)。東京大学教養学部基礎科学科卒業。趣味は農作業。
2 データの料理法
言葉は、人類にとって、おそらく最大で最高の社会共有財産だ。データは、その言葉を乗り越えて、人類の近未来を切り開いてゆくための、知的生産手段であって、人類絶滅を回避する、最後の希望だと考えている。
以前連載したデータ論「スモール・ランダムパターンズ・アー・ビューティフル」では、データを技術との関連で議論した。機械学習技術における、データサイエンスの発展という、安易な希望があった。現在は、『スモール・イズ・ビューティフル』(エルンスト・F・シューマッハー、講談社学術文庫-730、原著1973年)に近い立場で、巨大で独占されたAI(人工知能)ビジネスが、人類社会の未来を破滅に導くと、以前より悲観的に考えるようになった。
言葉(はっぱ)よりも根っこで人びとの生活を支えているのは、食事であり料理法だ。「おいしいデータの家庭料理」に、最後の希望をつないでいる。
2.1 生データのしたごしらえ
多くのデータは、藻類や菌類に近いようで、生で食べるとおいしくないし、危険な場合もある。データを採取することを、測定するという場合もある。おいしそうなデータを集めることができたら、データの料理法の最初の段階は、生データのしたごしらえだ。
◆データの味覚
フェナ:データを食べて、おいしいと思うのは、どのような味覚なのかしら。私なら、草を食べておいしいと思うけれども。
フェノじい:草を食べておいしいかどうかがわかるというのは、素晴らしい味覚なのだ。たぶん、母乳から離れるときに、家族や仲間においしい草を教えてもらって、味覚が訓練されたのだろう。味覚は複雑なので、記憶が大切になる。データも、記憶がないデータはありえないので、その記憶をたどれば、フレッシュなデータかどうか、2次加工されたデータかどうか、データが故意に改ざんされていないかどうかなど、ある程度はおいしそうかどうか予測できるようになる。
フェナ:おいしいデータを食べれば栄養になって、幸せな気分で寝ることができるということかな。朝になれば、おなかがすいて、その繰り返しだけど。
フェノじい:きびしく言えば、偶然の誤差や系統的な誤差(バイアス)のないデータはない。データのバイアスは、草のアクのようなものだろう。アクのない野菜はおいしくないよね。バイアスが推定できるようなデータは、おいしいデータで、バイアスを隠すデータは、食中毒になる、危険なデータなのだ。平均値にだって推定誤差がある。データの味覚は、誤差の<あじわい>ということか。
◆生データのフレッシュ感
フェナ:果物であれば、フレッシュジュースはおいしいわね。サルも果物は大好きじゃない。でも、生データではジュースになりそうもないでしょ。
フェノじい:生データのフレッシュ感は、データが発生してから記録されるまでの時間だけではないのだ。データ化する着眼点の新しさや、データの測定方法の工夫など、データから時代感覚が伝わってくるぞ。病気であったり、社会問題のデータが多かったりするので、おいしそうな果実がデータになっていることは、あまりないとしてもだ。
フェナ:じいの話は、時代感覚とか、大げさで難しいのよね。生データが生でなくなる料理法の話でしょ。果物だって、皮をむくのだし、まずは食べられない部分を、きれいに取り除くのよ。
フェノじい:生データの場合、食べられない部分を見分けることが難しいのだぞ。生データをしたごしらえする記録を「監査証跡」という。本当は、その記録を別途確認した記録を残すという意味だけれども、生データをしたごしらえする前に、データの問題点をあらかじめ想定しておいて、その問題点がすべて解決したという最終確認ができるように工夫されているわけだ。
フェナ:監査証跡という言葉にも、時代を感じてしまうわね。高価で大きなシステムを競っていた、昭和の感覚かな。生データがたくさんあって、その全部を使って、機械的にしたごしらえする現代では、死語になりつつあるかもね。
フェノじい:その<機械的>というのは素晴らしいけれども、完全には信用できないぞ。その機械が、データの所有者に、都合のよいように作られていないという保証はないではないか。データの所有者は、データで儲(もう)けようとしているし、時代感覚で、騙(だま)されたほうが悪いと考えているだろう。都合の悪い機械は、生まれてくることもできない。
フェナ:機械は偶然に生まれてくるだけよ。金儲けの役に立たない機械は育てないということかしら。金儲けの役に立たない機械は、金儲けに縁(えん)のない私たちには、良い機械かもね。もしスクラップになっていたら、拾って育ててみましょうよ。
◆だしの味
フェナ:データの味覚は、誤差の<あじわい>というのもわかりにくいわね。データが、海藻やキノコに似ているのなら、データでおいしいダシが作れるのかしら。
フェノじい:遠い未来、例えば1000年後にはデータのダシの味がわかるようになるか、その前に絶滅しているか……。海藻やキノコのダシの味も、もっと長い時間をかけて、食文化として伝承されてきたのだから。誤差の<あじわい>を、ダシの味として識別できるのは、データ文明の時代だろう。ダシの味が素晴らしいのは、食材の味を引き立てる、調理の万能処方だ。ダシに相当するデータの誤差分布を調べて許容範囲であれば、多くの素材データの誤差分布も想定できるようになる仕組みだぞ。
フェナ:そんなに未来の話ではなくて、今でも、おいしい家庭料理には、ダシの味がするものよ。料理に合うダシの種類がよくわからなくて、万能ではないだけ。
フェノじい:生データをしたごしらえする時に、複雑なデータに含まれるダシの味が想像できるようになれば、立派なものだ。縄文時代のスープでも、おいしいダシの味が、食材を引き立ていたに違いない。現代の経済データは、スープに似ているという説もある(※番外コラム1)。
◆調味料は控えめに
フェナ:みそやしょうゆなどの発酵食品は、健康に良いっていうじゃない。じいが大好きなお酒も、発酵食品だけど、健康に良いから飲んでいるとは思えないわね。草を食べる動物は、おなかの中で発酵させているわけ。データも発酵するのかしら。
フェノじい:旧式なコンピューターの中にあるデータは、変化しないように、厳重に蓄積されていた。最近のAIコンピューターでは、データをどんどん食べて、じょうずに動作できるように、蓄積したデータを分解して、並べ直している。膨大な量のデータを、おいしくなるように発酵させているようなものだな。その発酵のプロセスが、あまりにディープで、よくわからない。酒造りの杜氏(とじ)は、経験と勘で発酵をコントロールして、おいしいお酒を造っている。AIの酒も、おいしいからといって飲み過ぎると、高い税金を払うことになり、酔っぱらってしまうぞ。
フェナ:やっぱり、じいはお酒が好きなのよ。データの料理の話をしましょう。データを、おいしくしたごしらえするためには、調味料が大切ね。データの調味料って、どんなものかしら。何種類ぐらいあるのかなあ。
フェノじい:だしの味も含めて、調味料は5種類程度がいいところだろう。あまり多いと、使い方がよくわからなくなるぞ。それでも、スパイスの場合は、何十種類もあるけどな。データのしたごしらえは、誤差分布を<あじわう>ことがすべてだ。誤差といっても、何からの誤差なのか、よく考える必要がある。誤差をどう理解するのかということは難しい問題なので、宿題にしておこう。まずは単純に、データの分布が独立な場合と、相関がある場合がある。一番強力な調味料は、データを2値化して、2種類のデータが独立かどうか調べることだ。データに順番をつけて、カテゴリー化することも大切な調味料だ。相関がある変数を、まとめる調味料もある。外れ値を調べたり、欠測値を補完したりする場合もある。
フェナ:素材の味を大切にして、からだにやさしい料理にするためには、調味料は控えめにしたいわね。そもそも、じいの話はよくわからないし。
フェノじい:データのしたごしらえには、火を通したり、小さく切り刻んだり、もっと物理的な方法もあるぞ。
◆スロークッキング
フェナ:おいしい料理には、時間をかけた天日干しや、発酵食品など、食材の保存と丁寧なしたごしらえが大切じゃない。でも、データを料理する専門家は、いつも忙しそうね。そして、都会の人たちは、データの料理を、よく噛まないで急いで食べてしまうのよ。田舎の家庭料理はスロークッキングで、時間をかけておいしく食べましょうね。
フェノじい:スローであっても、のろまではないぞ。しみ豆腐などの寒ざらしは、凍結乾燥の優れた技術なのだ。おいしく料理するためには、食べるタイミングから逆算して、場合によっては季節感とも調和して、家族や仲間達と、食事の<位相>を合わせる必要がある。都会人は、自然や社会の<位相>を感じ取る能力を失ってしまったので、データの出発点をあわせて、無理やり同調させようとする。みんな忙しくしていれば、出発点で、みんなを無作為にバラバラにするのが精いっぱいだ。データにも、そんな時代感覚が浸み込んでしまう。
フェナ:じいは、また<位相>なんて難しいことを言っているけれども、なんだか怪しい話だわ。音なら音色、画像なら質感みたいなものが、データの<あじわい>にもあるということが言いたいのかしら。
フェノじい:音の音色、画像の質感、そしてデータの<あじわい>は、スペクトル分解してみたらわかるぞ。経済データでも、時系列データや空間データであれば、スペクトル分解できる。ただし、データ量が少ないと、<位相>を無視した、大まかなパワースペクトルしか推定できないけどな。地域データのスロークッキングで、地域経済のスローモーションが生成できるかもしれないぞ。1000年後の話かも知れないけどな。
●番外コラム1:
スープ的世界経済 地理と経済データについて学習していて、面白かった記事を紹介しよう(※引用1)。近代以降の世界経済はレゴ・ブロックであったけれども、最近はゴロゴロ具材のスープのようなものだという説だ。国家経済が個体(物理では固体)のように扱われていたのに対して、グローバル化と覇権国家の変容で、世界経済が不均一で動的に溶解しているというモデルだ。
そもそも、近代経済学では、自由市場における個人を理想気体のように取り扱っている。その理想気体が、多少は抜け道があるとしても、固い壁の国家に封じ込められているという、古典的な熱学・統計力学のモデルだ。経済のグローバル化だけではなく、大量移民や不法輸出入によって、抜け道が大きくなってしまい、しかも、政治的にブロック化された経済圏も、覇権国家の思惑で、動的に揺れ動いて、地殻変動が激しい。
この指摘は、世界経済だけの問題なのだろうか。地域経済の問題においても、大都市に一極集中する市場経済と、人口が激減し高齢化する地方経済の問題においても、経済の地盤が溶解し、「スープ化」しているように思われる。 日本では、ゴロゴロ具材のスープは野菜スープだけれども、英語の原文を読めば、ゴロゴロ具材は肉の塊(チャンク)であって、もっと生々しい比喩(ひゆ)だ。
拙稿『みんなで機械学習』第59回(https://www.newsyataimura.com/yamaguchi-142/、2025年3月31日)で、経済化学を提案したことがある。「スープ的思考」は、経済物理学と経済化学の混合物で、数理的にモデル化することは、ほぼ絶望的だ。しかし、データであれば、どのようなモデルでも表現できる。最近の地球科学が解明している地球の構造は、超高温のマントルに浮かぶ「スープ的大陸」と海洋を流れる深層海流、といったイメージだろうか。地下経済の深層海流を、データでとらえることができれば、経済学ももう少し「科学的」になるのかもしれない。
●番外コラム2:
宮沢賢治のネイチャーポジティブ 宮沢賢治が、地学に造詣が深かったことはよく知られている(※参考1)。しかし、宮沢賢治の作品を読んでいると、福沢諭吉の『学問のすゝめ』(岩波文庫、合本出版1880年)よりもさらに強く西洋の自然科学に傾倒して、しかも独自の自然観を探求していたことに、とても驚かされる。筆者の勝手読みでしかないけれども、宮沢賢治は、日本で最初のスピノザ主義者であって、フランスの哲学者オーキュスト・コント(1798~1857年)の実証哲学を体現していたと思われる。以下に農民芸術概論綱要の序文を引用しておこう(※引用2)。
おれたちはみな農民である ずゐぶん忙がしく仕事もつらい
もっと明るく生き生きと生活をする道を見付けたい
われらの古い師父たちの中にはさういふ人も応々あった
近代科学の実証と求道者たちの実験とわれらの直観の一致に於て論じたい
世界がぜんたい幸福にならないうちは個人の幸福はあり得ない
自我の意識は個人から集団社会宇宙と次第に進化する
この方向は古い聖者の踏みまた教へた道ではないか
新たな時代は世界が一の意識になり生物となる方向にある
正しく強く生きるとは銀河系を自らの中に意識してこれに応じて行くことである
われらは世界のまことの幸福を索ねよう 求道すでに道である
明らかに、個別学問としての地学の枠組みを超えている。筆者としては、スピノザの「神すなわち自然」を汎神論として解釈するのではなく、あくまで一神論として、万物を創造した唯一の位相と考えている。宮沢賢治の仏教的な宗教理解において、位相がどのようにかかわるのか、興味深い。
最近は、環境保護よりも積極的に、社会環境資源の再生を経営課題とする、ネイチャーポジティブが提案されている。筆者としては、経済や経営の枠組みにとどまらず、人びとの生活と自然(ネイチャー)の関係が、よりポジティブであるような、スピノザや宮沢賢治の世界観に、AI時代のデータとの共存・共生・共進化のヒントがあると考えて、拙稿を続けている。
※引用1:米気鋭の経済史家が語る「世界経済の見方を変える『スープ的思考』」とは何か?(Forbes JAPAN、2026年2月12日) https://news.yahoo.co.jp/articles/a944ace151da6fff5c3e479f538a560266bf360b
※引用2:『宮沢賢治 農民芸術概論綱要』(青空文庫、1926年)https://www.aozora.gr.jp/cards/000081/files/2386_13825.html)
※参考1『宮沢賢治の地学読本』(柴山元彦編、宮沢賢治作、創元社、2020年)
【目次案】「おいしいデータの家庭料理」
1 はじめに; データをおいしくする家庭料理
1.1 おいしいデータは栄養たっぷり
1.2 地域のデータをおいしくする
1.3 データの学習と食事
2 データの料理法<本稿>
2.1 生データのしたごしらえ<本稿>
2.2 データは発酵するのか
2.3 データの調理器具
2.4 データの献立表
2.5 データのフルコース
2.6 おいしいデータは、地域と人びとを健康にする
3 機械学習の学習
3.1 データをおいしく下処理してから機械学習する
3.2 機械と一緒にデータを学習する
3.3 機械と一緒にデータを使うビジネスを考える
3.4 楽しくデータの学習をする
3.5 データの学習は冒険でもある
3.6 機械と一緒にデータを使うビジネスの冒険をする
4 まばらでゆらぐデータの家庭料理
4.1 まばらでゆらぐ生活と経済のデータ
4.2 生活と経済を豊かにするデータの家庭料理
4.3 まばらでゆらぐデータの調理法
4.4 まばらでゆらぐデータで健康になる
4.5 データを使った生活と経済の予測
4.6 生活と経済のリスクを生き延びる
4.7 たくさんの小さな試行錯誤による適応
5 よりあいグループと社会
5.1 よりあいグループ(地域や家族)のデータ
5.2 よりあいグループのよりあいグループ
5.3 機械と学習するよりあいグループのデータ
5.4 よりあいグループのデータは廻る
5.5 よりあいグループのデータの周辺
5.6 よりあいグループのデータを予測する
5.7 よりあいグループのデータで社会問題を解決する
6 おわりに;生活と社会の近未来
6.1 ほとんど色即是空・空即是色な(まばらでゆらぐ)世界
6.2 まばらでゆらぐ人びとの地域社会
6.3 データでつながる、地域のNPOから国際NGO連合まで
--------------------------------------

技術的な内容は、「ニュース屋台村」にはコメントしないでください。「株式会社ふぇの」で、フェノラーニング®を実装する試みを開始しました。











コメントを残す