データのフルコース
『おいしいデータの家庭料理』第9回

4月 29日 2026年 社会

LINEで送る
Pocket

山口行治(やまぐち・ゆきはる)

株式会社ふぇの代表取締役。独自に考案した個体差の機械学習法、フェノラーニング®のビジネス展開を、栃木県那須町で模索中。元PGRD (Pfizer Global R&D) Clinical Technologies, Director。ロンドン大学St.George’s Hospital Medical SchoolでPh.D取得(薬理学)。東京大学教養学部基礎科学科卒業。趣味は農作業。

2.5 データのフルコース

家庭料理としては、運動会やお花見のための手作り弁当が精いっぱいで、フルコース料理は論外だろう。しかし、特別な機会に、集落や仲間たちで一緒に食べる料理であれば、役割分担ができるので、大規模な宴会もありうる。筆者が経験した地域の宴会では、イタリア集落でのサッカーワールドカップ観戦と、山陰集落での結婚式が忘れがたい。ともに、夜通し続く宴会で、地域の幸と酒が、ふんだんにふるまわれた。フランス料理や中華料理のフルコースは、宮廷料理がオリジンで、豪勢ではあっても、人びとの宴会のようなエネルギーはない。

データのフルコースも、政府統計や購買記録のような、ビッグデータの料理だ。豪華に見えても、個別データには規制がかかり、データ収集のコストと、データ処理の手間の割には、使い勝手が悪い。ビッグデータの限界を乗り越えて、人びとが宴会料理を楽しむ、データのフルコース料理から発想してみよう。

ビッグデータの限界を乗り越える

フェナ:最近はAI(人工知能)の話題ばかりで、ビッグデータは忘れられてしまったみたいね。ビッグデータは大企業には役立つけれども、多くの中小企業では微妙だったのかしら。

フェニイ:中小企業でも、顧客行動データを活用して収益を伸ばしている企業もあるけどな。ビッグデータの取り扱いには、データサイエンティストという特殊人材が必要で、従業員が勉強しても実用にはならなかったのさ。最近のAIでは、大規模言語モデルを使って、日常的な言葉で指示をすれば、人間以上の仕事をするようになったのだから、AIはビッグデータよりもずっとお手軽なんだ。

フェナ:最近のAIは、プログラムコードを作成できるらしいわね。IT技術者の仕事が奪われているというじゃない。データサイエンティストの仕事だって、AIは得意でしょ。でも、大量のデータが無ければ、AIだって仕事にはならないというのかしら。

フェニイ:データはどこにでもあるけれども、ビッグデータのように、経営に役立つデータにするのは大変なのさ。高級料理のビッグデータではなくて、バイキングデータにしたらどうかな。定額料金で、いろいろな料理を好きなだけ食べることができるのさ。

フェノじい:バイキング料理は、日本の帝国ホテルが発祥だと、AIが即座に回答したぞ。英語ではブッフェ料理のことだけど、肉料理をもりもり食べる、海賊たちの宴会料理のイメージがバイキングにピッタリじゃな。

フェニイ:それぞれのデータは、既に料理してあって、ユーザーは料理を組み合わせて食べるだけさ。しかも、ユーザーはやりたいことの指示を出すだけで、AIがデータを取りそろえてくれるようになったら、データサイエンティストも失業だな。

フェノじい:ビッグデータをデータサイエンティストが料理するフルコース料理よりも、B級グルメが何でもありのバイキング料理のほうが、若者向けじゃな。スモールデータだって、いろいろな種類をたくさん集めれば、役に立つかもしれんの。スモールデータ相互の関係をネットワークグラフとして整理するのは大変なので、機械学習に任せるとするか。どのように整理するのかは、ネットワークグラフの処理内容じゃが、専門用語を大規模言語モデルで翻訳するのじゃ。機械学習プログラムが、自動的に試行錯誤しながら、面白そうな構造が見えてきたら、生成AIのように、「はいできました」と提示する仕組みなら実現できそうじゃの。

フェナ:スモールデータをたくさん集めれば、結局ビッグデータになるということかしら。

フェノじい:AIがユーザーの指示を理解して、高速に試行錯誤することで、ビッグデータのように見せかけているだけじゃがな。

意味不明な網羅的センサーデータのフルコース料理

フェニイ:顧客行動データのように、何を考えているのかはわからなくても、少なくとも行動の意味が明確なデータは、バイキング料理にしやすいのさ。画像、音声、行動などのデータは、意味が理解しやすくて、教師データが作りやすい。しかし、センサーデータのように、測定はできても意味不明なデータもたくさんあるぜ。どうすればうまく料理できるのかな。

フェノじい:まずは、センサーデータが網羅的であるかどうかじゃ。モノの化学的性質を測定する場合、スペクトル解析をするようなものじゃの。モノの色をプリズムで分解する、分光分析が出発点じゃ。動物の生理的データであれば、少なくとも、その個体の年齢と性別が推定できるデータが、網羅的データの最低条件じゃの。地理のデータであれば、正確なGPS(Global Positioning System=全地球測位システム)の位置情報ではなくても、場所をある程度の精度で推定できるデータということになるのじゃ。写真に写っている風景でも、網羅性がある場合もあるぞ。網羅的という考え方は難しいけれども、データの意味を探索する手がかりのようなものじゃの。

フェニイ:センサーデータが何を意味しているのかわからなくても、それが単なるノイズであったとしても、データを多地点で同時測定すれば、データの位相が推定できるのさ。網羅性などという、訳のわからない話よりも、データの位相に注目するほうが現実的だぜ。

フェノじい:データに網羅性があるから、データの位相を推定できるのじゃ。フェニイの話では、多点測定がデータの網羅性に関連している。多人数のクチコミも、データの網羅性に関連していて、クチコミが波動性を示すのなら、位相だって推定できるぞ。クチコミデータが役立つことは確かだが、現実的かどうか、疑わしいものじゃな。

フェニイ:網羅的センサーデータがリアルタイムで取得できると仮定して、センサーデータのフルコース料理はどのようなものなのだろうか。

フェノじい:フルコース料理は宮廷のお偉方が、平和な時に楽しむ料理じゃの。権力者は、いつでも敵対者におびえていて、平和な時などほとんど無いのじゃが。網羅的センサーデータをリアルタイムで取得して、超高速にデータ処理すれば、最強の兵器になるし、人びとの大規模監視も実現できるぞ。権力者にとっては、願ってもないフルコース料理じゃの。

フェナ:網羅的センサーデータって、誰のものなのかしら。私の体の網羅的センサーデータなら私のものよね。でも、防犯カメラに写った私のデータは、警察のものなのかしら。防犯カメラが赤外線カメラなら、下着だって透けて見えるし、それは盗撮と同じじゃない。フルコース料理なんて、とんでもないわ。

フェニイ:だから意味不明なセンサーデータといったので、画像データは問題外だぜ。じいが網羅的データなどと言い出すから、政治に悪用されるのさ。悪用する悪党より、悪用される無防備な善人のほうが悪いという世の中だからな。データを悪用する可能性は、イチ割るゼロ(1/0)、つまり無限大さ。

スモールデータを大量に集積するネットワークデータベース

フェナ:スモールデータを大量に集積するネットワークデータベースが、従来のビッグデータの限界を乗り越えるかもしれないということね。ビッグデータの時代には、ロングテールの法則(※参照:https://www.murc.jp/library/terms/ra/long-tail/ )とかいって、ネットビジネスに特徴的なニッチ商品の役割が重要視されていたわよね。それってどうなるのかしら。

フェニイ:データ自体がロングテール化したともいえるな。ニッチなデータの在庫コストや、再利用のコストをネットワークデータベースが価格破壊するのさ。しかしネットビジネスのプラットフォーマー(グーグル、アマゾン、マイクロソフトなど)は独占化しているので、納得がいかない部分もあるけどな。

フェノじい:プラットフォーマーの技術も、ロングテールなオープンソースソフトウェアに依存しているので、ぐるぐる回しじゃの。ところで、ロングテール効果というのは、ネット商品の現象じゃが、スモールデータを大量に集積するネットワークデータベースでは、もっといろいろな現象が見つかるはずじゃ。実質的なデータ標準のような超独占状況や、「関係の関係」(※参照:番外コラム:表現の加減乗除)のもつれなど、何があっても驚かんぞ。

フェナ:ロングテールの法則は中小企業のネットビジネスに役立ったでしょ。「関係の関係」のもつれなんて、週刊誌記事にはなっても、ビジネスには役立ちそうもないわね。

フェノじい:現代の怪しい金融商品の市場構造は、「関係の関係」が入り組んでもつれておる。だから不確実で予測困難になるのじゃろう。ある程度、市場の構造が見えたからといって、予測可能になるとは限らないが、どこを観察すればよいのかというヒントが重要じゃの。市場を規制するのに有効なデータを取得できるぞ。市場は、市場自身の構造を理解する必要があるのじゃ。

フェナ:市場には、金融商品の市場のように巨大なものだけではなくて、地方の農作物の市場など、身近な市場もあるじゃない。おコメの市場は特殊かもしれないけれど、そのほか多くの農作物の市場と複雑に関係していそうね。政治や経済は好きになれないけど、市場をデータでリアルタイムに理解することは、確かに重要な気がするわ。

健康なデータのフルコース料理

フェナ:フルコース料理は、バイキング料理でも同じだけれど、食べ過ぎてしまい、あまり健康的とは言えないわね。データのフルコース料理も、やはり健康的ではないのかしら。

フェニイ:データの料理の場合は、食べるだけではなくて、健康診断のデータもあるのさ。健康診断のフルコース料理は、人間ドックだな。健康診断では、一般的に、血液検査と画像診断が組み合わされて、がん検診などの特殊な検査が追加されるだろ。人間ドックでは、心臓の検査なども追加されて、フルコース料理になるのさ。

フェナ:検査は年に1回か2回でしょ。食事は毎日だけど。フルコース料理は、皇帝様でない限り、年に1回か2回で、検査データと似たようなものかな。わたしは毎日の食事が大切だと思うし、ダイエットだって、毎日体重を測ることが、基本の基本よ。

フェニイ:血液検査だって、入院すれば毎日のように採血されるぞ。体温のチェックも毎日だ。体温や心拍数は、最近のスマートウォッチで、リアルタイムに記録することもできるぜ。だけど、画像データが無いと、じいの考えでは、網羅的データとは言えないな。顔色が良くないとか、肌に張りがないとかいうから、顔の画像をスペクトル解析すれば、年齢や性別が推定で来て、網羅的データになるかもね。

フェノじい:健康な生活を送るための、データのフルコース料理は、ビジネスとしても面白そうじゃの。血液検査は家庭では難しいけど、唾液(だえき)検査なら、コロナで経験済みじゃな。顔色スペクトルデータと体重計を組み合わせるのも面白そうじゃ。東洋医学では全身をチェックするので、マッサージチェアのデータも、むくみの指標になるなど、役立つかもしれんぞ。

フェニイ:最近のマッサージチェアは、AI機能もあるので、体組成計の機能や肌色スペクトル解析機能を追加することもできそうだ。たまには、裸でマッサージチェアに乗ってリラックスするのも、良いかもだぜ。

フェノじい:人間ドックのデータは、医療ビッグデータじゃな。健康マッサージチェアのデータは、個人のスモールデータで、それを寄せ集めてネットワークデータベースにすると、毎日の体調の変化をモニタリングできるという仕組みじゃ。

フェニイ:改造車のように、マッサージチェアを改造してみるか。

フェナ:毎日の体調の変化をチェックすることが、ダイエットの役に立つのなら、わたしも興味あるわ。氾濫(はんらん)している健康食品や、入浴剤など、多少でも効果が推定できるのなら、経済的にも意味があるでしょ。フェニイの改造車は疑問だけど、健康マッサージチェアが本当に役立つのなら、中小企業でも開発可能よ。未来のマッサージチェアが、世界を平和にする夢でも見ましょうね。

■番外コラム:表現の加減乗除

現代数学において、集合(モノと論理)から、関係(演算や写像)へと、基礎概念が変化している。前世紀における集合論の冒険において、モノはとらえがたく、論理は貧困だった。現代数学は、厳密な定義が可能ではあっても、極端に抽象的になり、生活世界から乖離(かいり)しているかのように見える。

筆者としては、フランスの数学者グロタンディーク(https://ja.wikipedia.org/wiki/アレクサンドル・グロタンディーク、1928~2014年)が切り開いた現代数学が、グロタンディーク自身が信じたように、平和を希求する人類の未来であることを期待している。そうすると、現代の生活世界が絶滅に向かっているのは、人びとの思考が、相変らず、モノと論理に束縛されていることに起因するのかもしれない。

データの世界では、離散的で計測可能なモノや出来事が全てだ。論理や関係は「確率的」にしか意味がない。数学の定義のような、絶対的な意味は、データの世界にはありえないのだろう。データの世界では、属性と事例によって構成されるデータ行列が所与である(実際に与えられている)ことだけが頼りだ。特定のデータ行列においては、属性と事例の定義を与えうるけれども、データ行列の値(データそのもの)は、定義から決定されるのではなく、測定誤差などを含んだ確率的な値でしかない。データ行列が異なれば、属性や事例の定義も異なる。このように所与でしかないデータの世界を、どのようにすれば、モノと論理の束縛から解放できるのだろうか。

数学には、表現論という研究分野がある。例えば、代数学で定義された抽象的な群の構造を、行列によって表現して研究する。虚数iの演算を、2×2行列で表現できることは高校数学の範囲で理解可能だ。数学のように、厳密な表現論ではないかもしれないけれども、データの世界にも表現論はありえるだろう。データの世界における論理を、個体差の表現として、緩やかな仮定を導入することで、より自由な論理を構成することを模索している。

数学の話をすると、難しくなってしまう。経済の価値について考えてみよう。経済的価値に足し算と引き算があることは、すぐにわかる。掛け算はどうだろうか。金利の複利計算のように、投資の世界では、掛け算も役立っている。遺産分割の例から想像できるように、割り算は難しい。難しい割り算は、データの世界で、どのように表現されるのだろうか。

データ行列や、データの共分散行列などは、逆行列が計算できない場合があり、単純な割り算は定義できない。厳密な数学であれば、割り算ができない場合があることは大問題になるとしても、そもそも確率的にしか意味の無いデータの世界なので、大雑把な割り算を考えてみよう。例えば、最大公約数を求める計算方法は、割り算の仲間と考えられる。整数の割り算のように、厳密に定義できるのであれば、2つの整数の最大公約数は、簡単な手順で計算できる。逆に考えて、最大公約数を求めることはできるけれども、割り算ができない状況もありうるはずだ。最大公約数を、対立する意見の「おとしどころ」と解釈すれば、日常的にどこにでもある計算になる。

意見の割り算をするということは、意見を素朴な「主張」に分解できるということを意味している。Aさんの意見が、素朴な主張に分解できて、Bさんの主張も、同じ語録での素朴な主張に分解できるのであれば、意見の最大公約数は共通する主張になる。しかし、通常は、Aさんの語録と、Bさんの語録が異なるので、語録間でのマッチングや再分解が必要になるだろう。語録間に「類似性」を想定できれば、あいまいな最大公約数的「おとしどころ」を見つけやすくなる。たぶん、現在のAI技術で実現できる「おとしどころ」は、以上のようなアルゴリズムになる。筆者としては、何か根本的な見落としがあると思える。

そもそも、AさんとBさんが意見を述べる「主体」としての視点が欠落している。AさんもBさんも、意見を述べる必要もないし、意見を述べることを拒否することもできるはずだ。そして、意見を述べる「表現の場」が前提条件とされている。

共通言語が存在するだけではなく、絶対的支配関係がないことが「表現の場」の存在条件だ。筆者は、「表現の場」には、ある種の割り算があると夢想している。ミニマルアートが豊穣な表現であると感じる主体は、作品や作者だけではなく、表現の場を体験している。

モノと論理に束縛されないデータの世界は、小さいデータ行列を、ネットワークでつないだ、「関係の関係」の世界として構成できる。データ行列の理論は、関係データベースとして実用化されている。したがって、データ行列のネットワークは、関係の関係ということになる。「関係の関係」の世界に割り算を発見することができれば、データの世界において割り算を理解できなかった、モノと論理の世界を乗り越えてゆくだろう。

表現にこだわることは、主体を無視しないことであり、「場所」を意識することでもある。数学は、既成概念を破壊する強力な武器になる。現代数学の破壊力は、AI技術という大量破壊兵器を無効化する、覚醒装置になりうる。人びとが現代の中世から目覚めるのは、1000年以上の未来かもしれないけれども、「割り算」について考え続けることは、哲学が死んだ世界で、無知の知の実践となる。

人口が指数関数的に増加する時代は終わりつつある。労働市場が経済成長の原動力だった時代の終焉(しゅうえん)でもある。ロボットの数が指数関数的に増加するかもしれないし、労働市場以外にも、経済成長の成長点を発見できるかもしれない。しかし、すでに巨大になり、自然環境や社会環境を破壊し続けているグローバルな経済活動を適切に制御できなければ、人類に未来はないだろう。

国家のスケールを超えて、巨大化した経済活動を、合理的に制御することは不可能だと思われる。しかし、様々な規制を合理的に組み合わせて、最大公約数的な「おとしどころ」を試行錯誤することは可能だ。データの世界を、みんなで機械学習して、「関係の関係」の世界として再構成することが出発点になる。その表現の場において、緩やかで大雑把な加減乗除を発見する冒険に、未来への希望を見いだしたい。

【目次案】「おいしいデータの家庭料理」

1     はじめに; データをおいしくする家庭料理
1.1 おいしいデータは栄養たっぷり
1.2   地域のデータをおいしくする
1.3 データの学習と食事
2     データの料理法
2.1 生データのしたごしらえ
2.2 データは発酵するのか
2.3 データの調理器具
2.4 データの献立表
2.5 データのフルコース<本稿>
2.6 おいしいデータは、地域と人びとを健康にする
3  機械学習の学習
3.1 データをおいしく下処理してから機械学習する
3.2 機械と一緒にデータを学習する
3.3 機械と一緒にデータを使うビジネスを考える
3.4 楽しくデータの学習をする
3.5 データの学習は冒険でもある
3.6 機械と一緒にデータを使うビジネスの冒険をする
4  まばらでゆらぐデータの家庭料理
4.1 まばらでゆらぐ生活と経済のデータ
4.2   生活と経済を豊かにするデータの家庭料理
4.3 まばらでゆらぐデータの調理法
4.4   まばらでゆらぐデータで健康になる
4.5   データを使った生活と経済の予測
4.6 生活と経済のリスクを生き延びる
4.7 たくさんの小さな試行錯誤による適応
5  よりあいグループと社会
5.1 よりあいグループ(地域や家族)のデータ
5.2 よりあいグループのよりあいグループ
5.3 機械と学習するよりあいグループのデータ
5.4 よりあいグループのデータは廻る
5.5 よりあいグループのデータの周辺
5.6 よりあいグループのデータを予測する
5.7 よりあいグループのデータで社会問題を解決する
6  おわりに;生活と社会の近未来
6.1 ほとんど色即是空・空即是色な(まばらでゆらぐ)世界
6.2 まばらでゆらぐ人びとの地域社会
6.4 データでつながる、地域のNPOから国際NGO連合まで

--------------------------------------

 技術的な内容は、「ニュース屋台村」にはコメントしないでください。「株式会社ふぇの」で、フェノラーニング®を実装する試みを開始しました。

コメント

コメントを残す