山口行治(やまぐち・ゆきはる)
株式会社ふぇの代表取締役。独自に考案した個体差の機械学習法、フェノラーニング®のビジネス展開を、栃木県那須町で模索中。元PGRD (Pfizer Global R&D) Clinical Technologies, Director。ロンドン大学St.George’s Hospital Medical SchoolでPh.D取得(薬理学)。東京大学教養学部基礎科学科卒業。趣味は農作業。
2.6 おいしいデータは、地域と経済を健康にする
日本の行政データは、近年急速に充実している。分野別や地域別に、使いやすく2次加工されたデータサービスも、有償無償、多種多様だ。しかし行政データを活用するためには、行政組織や制度を理解する必要がある。例えば犯罪データの場合は、都道府県別の警察の仕組みや、司法制度がとても複雑であるため、専門的な研究者でないと、公開されている犯罪データを活用することは困難だ。地域の治安のよさを比較する目的であれば、不動産業界や保険会社によって2次加工されたデータサービスを利用することが現実的だろう。しかし、治安の定義は、業界によって異なることに留意しよう。
既存のデータサービスに依存しないで、人びとが、公開データを機械学習する意味や価値はあるのだろうか。言葉の世界では、辞書や辞典がたくさんあって、専門家が膨大な数の書籍を執筆している。地域には図書館があり、人びとは、自由に会話をして文章を書いている。
データの世界でも、みんなで「おいしいデータ」を発見する冒険をして、地域のデータ活用を模索してみたい。公開されるまでに時間がかかる行政データを補完する目的で、リアルタイムに地域データを収集して、ビジネス活用してみよう。みんなで機械学習することで、地域と経済を健康にできる。
◆ピークデータ
フェナ:ビッグデータは忘れられて、最近ではピークデータが話題になっているようね。AI(人工知能)は電力だけではなく、データも爆食(ばくしょく)するので、安価なデータを食べ尽くしたみたいよ(※参考1:『米スタンフォード大報告書、AI学習データが枯渇しつつある「ピークデータ」を警告』、https://www.sbbit.jp/article/cont1/185277#image241413 )。
フェニイ:インターネットに氾濫(はんらん)している言語データを、AIが大量消費したということか。戦場のドローンデータは、大量消費されていても、相当高価で、フィジカルAIの主戦場さ。そもそも、現在のAIは、データの学習効率がとても悪いので、ビッグデータ時代のデータ大量消費から抜け出せないのさ。ピークデータの議論でも、現状のAIビジネスの限界を指摘するだけで、AI技術の未来展望については、まったく反省がないぜ。技術的にデータの学習効率を向上するだけでは、短期的なAIの延命策にしかならないけどな。
フェナ:フェニイは、リアルタイムでの、センサーデータ活用の話をしていたわよね。センサーデータなら、安価で大量に採取できるので、工夫次第で、ピークデータも乗り越えるということかしら。
フェニイ:センサーデータは意味不明なことが多いので、おいしく下ごしらえする工夫が大切だな。おいしいデータを食べれば、ピークデータの不安は忘れることができるのさ。おいしいかどうか、味覚や嗅覚(きゅうかく)は個人差が大きいし、化学的な測定も難しいけどな。視覚や聴覚などの、物理的測定とは、センサーデータとはいっても、だいぶ状況が違うので、即効的にピークデータの問題が解決できるとは思えないな。近未来への、冒険談のつもりさ。
フェノじい:世界の人口を100億人とすれば、100億人の健康データを、適当に組み合わせる組み合わせの数の計算にはn!(階乗)の計算が必要じゃ。100億の階乗をスターリングの公式で概算すると、log(n!)≒n*log(n)−n*log(e)だから(logは常用対数)、およそ956億5700万桁と計算されるのじゃぞ。100億、すなわち10桁の数字の組み合わせの数の計算には、1000億桁の計算が必要になるのじゃ。大きな数の階乗の計算が、エントロピーなどの、統計力学の計算が爆発する仕組みじゃの。ピークデータの問題など、AIビジネスの損得計算、すなわち足し算引き算でしかなく、貧困な想像力の世界じゃな。データの世界、もしくはデータで表現される関係の世界は、組み合わせの数の世界なので、100億人の健康データは、統計力学的な掛け算と割り算の世界としてしか理解できなほど、広大なデータの世界なのじゃ。フェニイも、データの世界を冒険するにしても、地図はないし、帰り道を見失わないようにするのじゃぞ。
フェニイ:個人の健康データが、人口の組み合わせによって爆発するのであれば、地域のデータも似たようなものさ。日本には1741の市町村(都の特別区23を加算)があるので、スターリングの公式でn=1741の階乗を計算すると、4887桁の数字になる。アボガドロ数が23ケタ、観測可能な宇宙の原子の数が80桁程度なので、市町村の組み合わせを考えると、あり得ないほど膨大な数になるのさ。ただし、地域データをメッシュ化すれば、画像の分解能のように、近接する地域のデータを調整して、計算可能になるということか。じいの話では、ピークデータは、データ間の関係を簡単なモデルに制約していることが、根本的な未解決問題らしい。
フェナ:スモールデータでは、データ間の関係を詳しく調べるのよ。モデルも複雑で、よくわからないわ。モデルは簡単なほうがいいわね。AIの大規模言語モデルとスモールデータの中間あたりに、新しい種類のデータがうずもれていそうな気がするわ。
フェノじい:じいとしては、個体差が無視できない個人の健康データを考えていたが、地域データも地域差が問題になるのじゃな。個人情報保護を気にしなくてもよいので、みんなで機械学習する課題になりそうじゃ。地域データを活用して、地域社会や地域経済を健康にするという課題を考えてみるか。
◆場所の網羅的データ
フェニイ:地域データは、場所のデータなのさ。場所を、地域メッシュのように物理的に考えるのか、市町村のように、政治・経済・歴史から考えるのか、場所をデータとして再考する必要があるな。じいは、網羅的なデータにこだわっているので、地域メッシュが有力だな。しかし、地域メッシュは、画像データに束縛されていそうな感じだぜ。逆に、特定の場所での「景観」から、政治・経済・歴史が見えてくるのさ。景観には、網羅性があるともいえるな。音の場所の網羅性では、音響の位相に注目することになるし、網羅性とはいっても様々だな。
フェノじい:まずは、複数の場所で同時測定する場合を考えて、さらに、グルッと廻(まわ)って継時測定する場合を想像しながら、地域データの場所性を再考するのじゃ。同時測定にしても、継時測定にしても、データにとっては、ナノ秒以下のデジタル時間が重要じゃな。だから、音波の位相が問題になるのだぞ。
フェニイ:同時多点測定は気象データのようなものだな。多人数で同時多点測定をするのは、スマホデータかな。みんなが自宅を出発して帰宅するまでの経時データであれば、少なくとも自宅の場所が固定された巡回経路になるな。センサーデータとしては、人感センサーや超高音域データなど、工夫すれば、スマホでも十分に対応できるのさ。経済活動や社会活動のオルタナティブデータを、みんなのスマホで収集するプロジェクトは興味深いぜ。GPS(全地球測位システム)データは使わずに、超正確な時刻データだけに依存するのさ。無意味なセンサーデータなので、個人情報の問題はないけど、同時多点測定で、予測困難な意味を発見するのさ。
フェノじい:国産スマホを活用して、地域データを収集すると、データ文明はデータの狩猟採集時代となるぞ。GPSデータや購買行動データなどの狩猟データは大企業に有償で販売するのじゃ。フェナやフェニイが想像している、社会的オルタナティブデータとしてのセンサーデータは、もちろん無償で、採取データとなるのじゃな。同時多点測定のデータであれば、データ間の関係が問題になるので、ピークデータのように、データ不足になることはあり得ないぞ。外国の主要スマホメーカーはAIスマホを志向しているけれども、AIが身近になって、SNS(ソーシャル・ネットワーキング・サービス)と融合すると、SNSの副作用が増大して、住みにくい社会になりそうじゃ。そもそも、行き過ぎた個人主義であるため、住みやすい社会を実現しようなどとは考えておらんぞ。意味不明な地域データスマホの社会実験は、みんなで機械学習をする共同プロジェクトで、健全なAIスマホを先取りしているのじゃ。
フェニイ:地域の網羅的センサーデータをリアルタイムで取得する、健全なAIスマホを想像できるのなら、作ってみたいな。例えば、超音波マイクとスマホをつないで、コウモリを探すソフトがあるけど、機械音に含まれる超音波をモニタリングできそうだ。複数人の同時多点測定で、音源を同定するのさ。超音波は建物で反射するし、複雑に吸収されるので、地域内の社会活動や経済活動のオルタナティブデータになる可能性があるぜ。
フェナ:地域データスマホを持って、街を歩く冒険ね。面白そうじゃない。でも、地域内の社会活動や経済活動のオルタナティブデータを活用するためには、まずは地域の行政データを勉強して、何を知りたいのか、何を予測したいのか、どのような問題を解決したいのか、ある程度、目標を決めておかないと、データの森で迷子になりそうよ。冒険だけではなくて、予習と復習も計画しましょ。
◆廻る地域経済
フェナ:地域おこしというのは、地域経済が成長したり、地域社会が元気になったりするということよね。時代の変化に対応して、地域の魅力を発見することが大切でしょ。だから、時代の変化に敏感で、未来への希望を大切にする、若者が主役になるのよ。老人は自己満足しやすいし、子供たちを育てる必要がないので、未来に責任がないじゃない。でも、地域経済が成長したり、地域社会が元気になったりするって、どういうことなのかしら。大都市以外では、若者が増えることは考えにくいし、移民の問題もありそうよね。政治家の言う地域おこしは、私には理解できないのよ。
フェニイ:俺たちがアルパカだということを忘れそうになるぜ。那須町のアルパカ牧場がなくなって、俺たちは、幻想の世界で生きているのさ。データの世界は、幻想の世界の対極かな。データ地域おこしと言えば、政治家の発言ではなくなるぞ。もっと理解できなくなるとしてもだ。理解する前に、行動をして、行動の結果を理解する方法もあるのさ。
フェナ:フェニイは、いつからアメリカ哲学になったのかしら。プラグマティズムよ。先住民を迫害して、バッファローを絶滅させてしまった。その結果は、先住民が受け入れられる世界ではなかったでしょ。理解できなくても、探求せずに行動でごまかしては駄目よ。
フェニイ:データ文明は、1000年後かもしれないし、すでに始まっているかもしれないな。俺たちは幻想のアルパカなのだから、気長に生きるとするか。経済学では、ケインズ先生(ジョン・メイナード・ケインズ、英国の経済学者、1883~1946年)が、政策に経済学を応用して、投資による指数関数的な経済成長を描いて見せたのさ。でも、投資の社会的な回転による、経済の好循環は疑わしいぜ。投資では、貧富の差が大きくなるだけで、経済は廻らないのさ。地域社会において、経済が廻ることを、どのようにデータでとらえるのか、地域経済データの出番だぜ。
フェノじい:データが廻るためは、データをベクトル場として考えるのじゃ。以下にAIの解説を引用しておくぞ。
「ベクトル解析におけるダイバージェンス(発散:Divergence)とローテーション(回転:Rotation/Curl)は、ベクトル場(流体の速度場や電磁場など)の空間的な特徴を理解するための非常に重要な概念です。これらは「ナブラ演算子」を使って計算され、物理現象の理解(流体力学や電磁気学など)に不可欠です。(1)ダイバージェンス (Divergence / 発散)の意味: その点からベクトルが「湧き出している」か、「吸い込まれている」かを表す。特徴:計算結果はスカラー(数値)になる。(2)ローテーション (Rotation / 回転)の意味: その点の周囲でベクトルがどれだけ「回転」しているかを表す。特徴:計算結果はベクトル(向きと大きさ)になる。(3)補足:重要公式、回転のダイバージェンスは常に0:(渦の湧き出しは存在しない)、勾配の回転は常に0:(スカラー場の勾配には渦がない)、この2つの公式は、電磁気学のマクスウェル方程式を理解する上で、最も基本的な公式となります。」
どうかな、とても分かりやすい解説だと思うのじゃが、AIとしても、これでデータが廻るとまでは想像できないじゃろ。
フェナ:地域経済が廻るのはとても大切ね。廻らないと最悪だけど、回転が早すぎても、遅すぎても不都合だわ。地域社会が廻るということは、関係人口が増えるということかしら。経済が廻って社会も廻る、投資を引き金にして社会が廻る、そんな地域おこしを計画してみたらどうかしらね。
◆地域と経済の健康
フェナ:米国のビリオネアが大切にしている3P(Power、Profit、Pleasure)は、裸の王様という感じじゃない。私たちアルパカとは無縁の世界ね。データの世界も3Pとは無縁だし、米国のビリオネアも、時代遅れになっているのよ。以前は4P医療といわれていたのが、集団的(Population-based)のPを追加して、5P医療に進化しているのよね(AIの要約;「5P医療は、ITやゲノム情報などを活用し、『病気になってからの治療』から『健康の維持・増進』へと医療のパラダイムを転換する包括的なアプローチです。個人に最適化された持続可能なヘルスケアシステムを目指し、予測(Predictive)、予防(Preventive)、個別化(Personalized/Precision)、参加型(Participatory)、集団的(Population-based)の5つの柱で構成されます。」)。ビリオネアの3Pなんて不健康そのものね。
フェニイ:健康な地域経済も、3Pではなくて、5Pだぜ。みんなで地域データを機械学習すれば、5Pそのものさ。参加型(Participatory)というのは、かっこいいな。
フェナ:地域社会の場合は、5Pはちょっとどうかしら。政治的すぎるように思うけど。日常生活は、健康であっても、病気であっても、生きてゆくしかないのだし。前向き(Positive)だけで十分よね。
フェニイ:地域経済が廻る、健康な経済回転スピードは季節変動するぜ。データ経済は、データを拾い集める採取経済なのだから、天候に左右されるのさ。異常気象もあるし、経済回転スピードを調整するために、天気予報が大切なんだ。
フェノじい:米国のビリオネアに経済を支配されて、欧州各国の人々は不満がたまっているようじゃの。データ経済で、地域経済が廻るようになるのは、近未来の話だし、それまで生き延びられるのか、なんとかせねばな。そもそも、経済はスケールメリットがあるので、大国が有利になりやすいのじゃ。大学を中心にして、知的財産を地域に集積することで、経済発展した時代もあったのじゃが。おいしいデータを集積して、知的財産権を発掘する作戦でも考えてみるかのう。
フェニイ:大学は、教育投資の対象ではあったけど、若者が減少しているので難しいな。地方では、病院が中心になって、老人社会になっているのさ。老人は、お金を持っていても、未来への投資は苦手だぜ。昔話は投資にならないんだ。都会では、ビリオネア予備軍ばかりだし。
フェノじい:老人にとっては、認知症予防が投資対象になるぞ。なんといっても、人類はみな「認知症を生きている」のじゃから、認知症予防は、大きな成果が期待できる投資対象じゃの。資本主義経済も「認知症を生きている」。経済成長の割り算を発明して、地域経済の認知症予防に役立てたいものじゃ。
フェニイ:俺としては、地域データスマホに投資するぜ。クルマ社会が発展していた時代は、自動車産業が国の経済を支えて、地域経済を廻していたのさ。現在の車社会は、社会インフラとしての問題を抱えて、制約が多くなって動きが鈍いな。技術的にも、電気自動車(EV)の自動運転に停滞感があるぜ。これからは断然、スマホ社会の時代さ。日本の携帯電話が、iモードで元気だった時代は、日本経済も廻っていた。AIスマホで、米国と中国が世界経済を支配する最終段階になり、スマホ社会の副作用が膨張して、生活へのしわ寄せが顕著になるのさ。地域データスマホで、スマホ社会をより健康にするとか、集団的認知症の予防に役立てるプロジェクトは、絶好の投資機会だぜ。
フェナ:集団的認知症は、停滞する社会の、文化の病気のようなものかしら。高尚な文化というよりも、不健全なネットワーク社会の、不健康な習慣の問題よね。スマホ依存症が問題になっているけど、AIスマホで、集団認知症が悪化するのよ。なにしろ、AIスマホで儲(もう)けようとしている米国のビリオネアたちは、3Pの社会的不健全を妄信(もうしん)していて、世界中のデータを独占しても満足できない、裸の王様なのだから。フェニイの地域データスマホを使えば、健康な生活習慣になるのかしら。意味不明なデータを採集する目的であったとしても、毎日歩き回ることは健康な習慣よね。スマホの中で、意味不明なデータが、おいしいデータに発酵すると、地域と経済が、もっと健康になりそうだわ。地域と経済が健康になって、みんなで機械学習の学習を楽しむと、もっと地域と経済が健康になるのよ。私としては、難しい機械学習の学習を楽しむことはできないので、じいに、わかりやすく気長に教えてもらいましょう。
●番外コラム:形を維持して成長する
前稿(※参考:『おいしいデータの家庭料理』第9回、「番外コラム:表現の加減乗除」https://www.newsyataimura.com/yamaguchi-168/)では、データの世界における割り算の例として、最大公約数的な「おとしどころ」について考えてみた。
掛け算は、指数関数のイメージだ。樹木では、光を求める新芽や、水分を求める根端(こんたん)など、成長点は、指数関数的に試行錯誤する。成長点とは別に、樹木の地上と地下、それぞれが形を維持して成長する。全体の形は維持されるけれども、巨木になることもある。形を維持して成長するメカニズムは、割り算的な成長と考えられる。
人口増加などの、指数関数的な成長だけではなく、形(構造)を維持する、割り算的な成長もあり得る。割り算は、どのような状況(構造)でも可能だとは限らないので、適当に丸めて、概算としての割り算を考えることになる。割り算のあまり(剰余)に注目すると、全体の構造が見えてくるから不思議だ。
以前(2023年3月15日)、『マザーツリー 森に隠された「知性」をめぐる冒険』(スザンヌ・シマード、ダイヤモンド社、2023年)を紹介したことがある(※参考;『みんなで機械学習』第17回、https://www.newsyataimura.com/yamaguchi-87/)。マザーツリーは、周囲を圧倒する勝者ではなく、周囲に配慮して、栄養分を供給する森の知性だ。巨木としての自らの形だけではなく、周囲の環境も維持する「割り算」を心得ている。利他行為を、損得計算の足し算や引き算ではなく、構造を維持する割り算と見なすことが、人間の知性を超えている。
市場経済においても、指数関数的な投資だけではなく、割り算を心得たマザーツリーが必要だと気がついた。掛け算と割り算のバランスで、経済成長を最適化できないだろうか。市場経済に波及するのには時間がかかるとしても、少なくとも、AIの思考パターンを、人間が理解しやすい足し算と引き算のバランスではなく、人間を超えた知性としての、掛け算と割り算のバランスとして再解釈する事は可能だ。
AIが人間の知性を超えるときに、AIを機械としてではなく、AIの知性を、動物よりも進化論的な意味で新しい生命である高等植物の知性として再解釈すれば、AIとの共存・共生・共進化が想像しやすくなるだろう。
【目次案】「おいしいデータの家庭料理」
1 はじめに; データをおいしくする家庭料理
1.1 おいしいデータは栄養たっぷり
1.2 地域のデータをおいしくする
1.3 データの学習と食事
2 データの料理法
2.1 生データのしたごしらえ
2.2 データは発酵するのか
2.3 データの調理器具
2.4 データの献立表
2.5 データのフルコース
2.6 おいしいデータは、地域と経済を健康にする<本稿>
3 機械学習の学習
3.1 データをおいしく下処理してから機械学習する
3.2 機械と一緒にデータを学習する
3.3 機械と一緒にデータを使うビジネスを考える
3.4 楽しくデータの学習をする
3.5 データの学習は冒険でもある
3.6 機械と一緒にデータを使うビジネスの冒険をする
4 まばらでゆらぐデータの家庭料理
4.1 まばらでゆらぐ生活と経済のデータ
4.2 生活と経済を豊かにするデータの家庭料理
4.3 まばらでゆらぐデータの調理法
4.4 まばらでゆらぐデータで健康になる
4.5 データを使った生活と経済の予測
4.6 生活と経済のリスクを生き延びる
4.7 たくさんの小さな試行錯誤による適応
5 よりあいグループと社会
5.1 よりあいグループ(地域や家族)のデータ
5.2 よりあいグループのよりあいグループ
5.3 機械と学習するよりあいグループのデータ
5.4 よりあいグループのデータは廻る
5.5 よりあいグループのデータの周辺
5.6 よりあいグループのデータを予測する
5.7 よりあいグループのデータで社会問題を解決する
6 おわりに;生活と社会の近未来
6.1 ほとんど色即是空・空即是色な(まばらでゆらぐ)世界
6.2 まばらでゆらぐ人びとの地域社会
6.4 データでつながる、地域のNPOから国際NGO連合まで
--------------------------------------

技術的な内容は、「ニュース屋台村」にはコメントしないでください。「株式会社ふぇの」で、フェノラーニング®を実装する試みを開始しました。











コメントを残す