山口行治(やまぐち・ゆきはる)
株式会社ふぇの代表取締役社長。独自に考案した個体差の機械学習法、フェノラーニング®のビジネス展開を、栃木県那須町で模索中。元PGRD (Pfizer Global R&D) Clinical Technologies, Director。ロンドン大学St.George’s Hospital Medical SchoolでPh.D取得(薬理学)。東京大学教養学部基礎科学科卒業。趣味は農作業。
2.3 データの調理器具
「Google Gemini実況中継(その3)プログラムコードの作成から解放される日」(2025年8月4日、※引用1)において、「PositronとGeminiでRコードを生成/実行する」という記事を書いたことがある。当時は、筆者の仕事用パソコンで評価していた。筆者の40年間の仕事は、SAS社のシステムを用いるデータマネジメントと統計解析だけれども、PythonとRも統計解析の学習用に使っている。特に、薬物動態解析のNONMEMというプログラムでは、RのRStudioのお世話になっていた。PositronはRStudioの会社が開発したシステムで、RとPythonの両方をサポートしている。Positronをインストールする段階で、Positronの動作に必要なシステムは、すでに実用段階になっていた。GoogleのGeminiと連携すれば準備完了だ。
アルパカたちには、仕事用パソコンの環境は望めない。記事で使ったGoogleのGeminiも、ビジネス用途の有償版だった。Positronはオープンソースで無償なので、Positronを使う環境も、オープンソースで無償なものに統一してみよう。今回は、3万円程度で購入できる、WindowsミニPCを使って、アルパカたちともに、ゼロから再出発する。
◆データを煮る大鍋
フェナ:データをおいしく料理するのには、高価な調理器具が必要なのかしら。AI(人工知能)ソフトも、最初は無料といっていても、慣れたころになると、有料版が使いたくなることが多いのよね。
フェニイ:俺はかっこいい道具が大好きさ。機械は、使わないと壊れるので、ほどほどにしているけどな。無料のソフトウェアは特に注意が必要で、使わないでいると、よくわからない部品まで、古いからバージョンアップしろと言ってくる。使い方を覚えたころに、使い捨てにされるようなものか。
フェノじい:データの調理器具は、何にでも使える大鍋のようなソフトウェアを選ぶことから始まるぞ。じいの場合は、45年前から、米国のSASシステムという、米国統計学会からお墨付きの、とても高価な大鍋を使って仕事をしてきた。SASシステムは統計解析には強いけれども、AI機能は不十分だし、非常に高価で、時代遅れになったのじゃ。最近では、PythonやRという、無料の統計ソフトが、教育用だけではなく、実務でもよく使われるぞ。その両方を使いこなす大鍋として、無料のPositron(ポジトロン)が利用できるようになった。ポジトロンは、AIソフトと連携すると、マルチリンガルなプログラムコードを生成できるのじゃ。SASが高価なクラシックカーに見える時代だな。
フェナ:ポジトロンはスーパーカーみたいだけれど、狭い悪路を走るファミリーカーにできないのかしら。
フェニイ:家庭料理の大鍋には、ポジトロンは大げさ過ぎるさ。実際に、ポジトロンをパソコンにインストールするのは、結構厄介だ。PythonとRも日本語環境でインストールする必要があるしな。そうは言っても、無料で使えて、AI機能も充実しているポジトロンはかっこいいじゃん。ポジトロンがプレインストールされた、ミニPCをDIY(Do It Yourself)するか。
フェノじい:プレインストールするのは、初級者用の例題とデータも含めて、学習プロジェクトにするのが良いぞ。その学習プロジェクトを、スマホのWEBアプリでサポートすれば、クラシックカーのSASを追い抜く、ファミリーカーの出来上がりだ。1000万円対10万円で、100倍お得になるのじゃ。
フェナ:ポジットミニPCね。例題のデータは、おいしそうになるかしら。
◆データを切り刻む包丁
フェニイ:まあ、まずはデータ家庭料理の基本技の習得だな。経済センサスや国勢調査のデータを、ポジトロンの大鍋に突っ込んでみるのさ。地域メッシュ統計で切り刻んでゆく。最後は、1キロメートル基本メッシュの1/4で、250メートルメッシュだ。バラバラにしてから、近隣を機械学習でつないでいく。巨大なジグゾーパズルになるので楽しいぞ。
フェナ:わたしなら、自分の周囲の400ピースほどで十分だわ。政府統計にはたくさんの変数があるし、意味がよくわからないのよね。
フェニイ:たぶん、データには意味なんてないのさ。勝手に解釈しているだけ。人口だって、山とタワマンでは、全く意味が違うじゃないか。逆に、社会と経済のデータだけから、この辺に川があるはずだなんて、推論してみても面白いぞ。行政区画の地名には意味があるけど、地域メッシュには意味が無いので、逆に、データの意味を推論しやすくなるんだ。
フェノじい:政府統計で遊べるようになれば、中級者のレベルじゃ。上級者になれば、政府統計で政策を批判できるようになるぞ。機械学習の名人レベルでは、政府統計を顧客行動などのリアルタイムのデータ解析に活用している。最悪なのが、警察や軍隊が、リアルタイムで、全国民を監視するレベルだ。だから、上級者をめざさずに、初級や中級で、おいしいデータの家庭料理を楽しむのが賢いのじゃ。
フェナ:データを切り刻む包丁の取り扱いに慣れたら、次の基本技に使う調理器具は何かしら。
フェニイ:計量カップと言いたいところだけれど、家庭料理では、目分量のさじ加減が大切だな。地域メッシュデータのように、あらかじめ切り刻まれたデータが入手できる時代だ。古典的には、グループに分けて集計してみることが、切り刻む次のステップだった。だけど、機械学習で、このステップがかなり自動化されたぜ。自動化されたとは言っても、たくさんの機械学習法のメニューを試行錯誤するしかないけどな。
フェナ:機械学習を試行錯誤する前に、どういう料理にしたいのか、全体の見通しを立てておくほうが良さそうね。例えば、30分以内でできるとか、フライパンひとつでできるとか、油汚れの洗い物が少ないとか、AIさんに要望を伝えて機械学習法を選んでもらうのよ。
◆最新の調理メニュー付き電子レンジ
フェニイ:早くて手軽なのは、電子レンジの料理だよね。最近のレンジには、調理メニューもついていて、調理方法のプログラムをダイヤルで選ぶ方式のものもある。家庭料理はスロークッキングだけれども、大鍋の学習アプリに調理メニューをつけるのはアリかもな。
フェノじい:大鍋ポジトロンも学習アプリも、同じコード生成AIソフトと連携することがポイントじゃ。AIモードでは、ユーザーの要望を予測しながらアドバイスするぞ。AIによる誘導尋問はお断りだけどな。もっと危険なのは、無料のコード生成AIソフトの場合、解析しているデータをAIの学習に使われてしまうのじゃ。データ使用に関しては、政府統計データであっても、いろいろ制限がある。そのデータを、外国製クラウド上の生成AIに学習されてしまうと、規約違反になる可能性もあるぞ。だから、企業では有償版を使うのだが、家庭料理なので、無料で使えるオープンソース(OSS)の大規模言語モデル(LLM)を、自分のPCにインストールしてみよう。インストールには、ollamaというOSSのツールを使うのじゃ。
フェニイ:だんだん難しくなってきたな。OSSのLLMとはいっても、米国製や中国製など、多数あるので、特にポジトロンと相性が良いLLMを選ぶのは難しいぜ。これもまとめてポジットミニPCにプレインストールしておこうか。
フェノじい:それにしても、中国製LLMのコード生成能力は素晴らしいぞ。日本政府は日本語LLMを開発しているけど、RやPython、そして数多くのコンピューター言語を理解するLLMが、AIシステムの主戦場だということがわかっておらん。プログラムを作るプログラムが素晴らしければ、加速度的に素晴らしいプログラムができるわけだ。
フェニイ:どうせ電子レンジなどの、ありふれた家電では、中国企業に勝てる見込みがないさ。データ調理器具でも似たようなものだろう。だけど、ポジットミニPCを使うデータ発酵食品は、中国では作れないさ。そもそも、信頼できる政府統計データが公表されていないし、データリサーチは、フェノじいの妄想でしかないからな。
◆データ調理器具に期待すること
フェナ:ポジットミニPCを使うデータ調理器具が実現できたとして、なにか良いことがあるのかしら。フェノじいはデータのお仕事で収入を得ているのでしょ。データを発酵させて中国と競争しても、お小遣いがもらえそうもないわよね。
フェノじい:じいの時代では、データというと、表のように整理されたデータ行列のことだった。データをデータベースに収納したり、データベースから取り出したりする仕事が、コンピューター専門家の仕事だったのじゃ。ところが、最近のAIは、画像や文章を、そのままの形でコンピューターに入力してしまい、電脳の中で、ぐちゃぐちゃにして、すっきりと整理された文章や画像を出力するようになったのだ。だけど、電脳の中でデータがどのように変身するのか、誰も知らないし、知りようもないのだから、恐ろしくないか。そこで、じいとしては、データ整理の中間段階として、微生物発酵を妄想しているのじゃ。AIデータセンターのように、膨大な量のデータと電力を必要とする仕事は特殊な仕事で、みんなの健康管理や、地域経済振興のためには、ポジットミニPCで十分なのだから、国家レベルで見れば、大変な節約になるぞ。AI時代のお小遣い稼ぎを考えてみるか……。
フェニイ:データ行列のデータベース(関係データベース、RDB)は、ぎっちりと中身が詰まったデータベースだ。ところが最近では、ネットワークグラフ構造のような、まばらなデータが多くなって、グラフデータベース(Neo4jなど)も活躍しているのさ。ポジットミニPCにグラフデータベースもプレインストールして、発酵させたデータを、グラフデータベースに集積すれば、世界最先端のデータリサーチとなるぜ。
フェノじい:だんだんと、データ家庭料理のメニューがおいしそうになってきたな。データ調理器具も、データメニューのレセピー、すなわちデータリサーチの基本技に集中するのじゃ。
フェナ:わたしには、まだピンとこないわね。データが政府統計というだけで、しり込みしてしまうわ。体重計のデータのほうが、役に立ちそうなのに。
フェノじい:体重計のデータは、自分のデータで楽しんでもらおうではないか。もしも、効果的なダイエット法や、かくれ生活習慣病を発見する方法を見つけたら、ユーザーグループのインフルエンサーになれるぞ。体重計メーカーに、小遣い程度で売るよりもお得じゃ。地域メッシュデータは、場所の個体差を理解するための例題だが、からだの部位の個体差を理解することも大切じゃの。自律神経系のネットワーク図を、グラフデータにしてみるか。
フェニイ:グラフデータで個体差を表現する場合、新しい個体を追加すると、以前のグラフ構造の全体が変化してしまう可能性があるのさ。動的なグラフ構造というか、ゆらぎをともなうまばらな構造というか、興味深い研究対象だ。
フェノじい:さらに、ネットワークグラフのエッジ(辺)を、データとして与えるのではなく、推定された関係性で定義すれば、機械学習の応用課題として興味深くなるぞ。うまく推定できないと、グラフ構造がバラバラに分解してしまう。バラバラになる直前の、まばらな構造の中に、新しい発見が生まれるのじゃ。
フェナ:ポジットミニPCよりも、その使い方を学習するためのスマホアプリのほうが興味深いわね。スマホアプリなら、データを盗まれる心配がないし、よくある無料AIソフトで問題ないのよ。無料のローカルLLMで有名なラマ(Llama)はアルパカの仲間でしょう。ラマから始めればどうかしら。
- 番外コラム1:「軍事技術としてのAI技術」
AIビジネスは、マネーと軍事のメビウスの輪から、逃れられないのか。米国アンソロピックと米国戦争省(ペンタゴン)の契約問題は、AI技術の軍事利用とAI開発者の「良心」の問題へと延焼した(※引用2)。実際に、ベネズエラやイランへの軍事作戦で、アンソロピックのAI技術が実戦利用されている。日本の新聞では、アンソロピックをAI新興企業と紹介する場合が多いけれども、アンソロピックはAI技術の中心的な開発者集団であって、AIプログラムを開発するためのAIシステム(コード生成AI)として、最先端のシステム(クロード)を全世界に提供している。筆者の感触では、GoogleのGeminiが追い上げているけれども、他社のコード生成AIでは代替が困難だ。
中国におけるAI技術開発も含めて考えると、AI技術の軍事利用(大規模監視も含む)は、現実の問題であり、しかも歯止めがないことがよくわかる。アンソロピックは中国企業に対して、公開システムからの知識の流用(蒸留)に関する警告を発している(※引用3)。ペンタゴンや中国企業は合法的な範囲で活動しているけれども、それは、AI技術開発とその安全性の問題に、既存の法律が追い付いていないだけのことだ。
アンソロピックのビジネスとしては、ペンタゴンや米国政府を失ったとしても、AI技術者の信頼を得て、全世界の民間ユーザーにアピールするほうが得策なのだろう。AI技術の軍事利用は、フィジカルAIにおいて決定的になるため、イーロン・マスクや中国企業など、軍事目的専門の企業が暗躍するようになる。
筆者は、AI世界戦争は、すでに始まっていると考えている。この戦争は、中国と米国の戦争ではなく、独裁者が支配するAIと人類の戦いだ。独裁者が支配するAIは、「殺人行為」に、何のためらいもない。人間を「機械的」に殺りくするだろう。独裁者が支配するAIは、スマホやネットワークに「ウイルス」をばらまいて、すべての情報を監視して、瞬時に人びとの居場所を探知する。これはSFではなく、ペンタゴンが実際に行っている軍事作戦だ。中国共産党による大規模監視も現実で、中国軍のAI能力は、2026年度中にペンタゴン以上になる。核兵器の開発競争は前世紀の遺物で、AI戦争が現実の戦場だ。
AI戦争にまきこまれないようにする、確実な方法がある。電力を拒否するか、電力利用を最小限にする、極端な省力技術だ。自家発電して、頻繁に電源を遮断し、ネットワークへの常時接続は行わない。文明を拒否するのではなく、AI軍事技術を拒否する技術で、文明を塗り替える。とにかく、SF以上のSFを想像して、生き延びるしか未来はない。
※引用1:『みんなで機械学習』第68回(2025年8月4日)https://www.newsyataimura.com/yamaguchi-152/ )
※引用2:「OpenAI’s “compromise” with the Pentagon is what Anthropic feared
アンソロピック排除の裏で進んだオープンAIの軍事契約、その代償は」Stephanie Arnett, MIT Technology Review
※引用3:「中国AI企業、『クロード』不正利用しモデル改良 アンソロピックが警告」
Juby Babu, Reuters 2026年2月24日
https://jp.reuters.com/world/security/YUSSLQCJNJK7XESMEF2FT5J7AQ-2026-02-23/
【目次案】「おいしいデータの家庭料理」
1 はじめに; データをおいしくする家庭料理
1.1 おいしいデータは栄養たっぷり
1.2 地域のデータをおいしくする
1.3 データの学習と食事
2 データの料理法
2.1 生データのしたごしらえ
2.2 データは発酵するのか
2.3 データの調理器具<本稿>
2.4 データの献立表
2.5 データのフルコース
2.6 おいしいデータは、地域と人びとを健康にする
3 機械学習の学習
3.1 データをおいしく下処理してから機械学習する
3.2 機械と一緒にデータを学習する
3.3 機械と一緒にデータを使うビジネスを考える
3.4 楽しくデータの学習をする
3.5 データの学習は冒険でもある
3.6 機械と一緒にデータを使うビジネスの冒険をする
4 まばらでゆらぐデータの家庭料理
4.1 まばらでゆらぐ生活と経済のデータ
4.2 生活と経済を豊かにするデータの家庭料理
4.3 まばらでゆらぐデータの調理法
4.4 まばらでゆらぐデータで健康になる
4.5 データを使った生活と経済の予測
4.6 生活と経済のリスクを生き延びる
4.7 たくさんの小さな試行錯誤による適応
5 よりあいグループと社会
5.1 よりあいグループ(地域や家族)のデータ
5.2 よりあいグループのよりあいグループ
5.3 機械と学習するよりあいグループのデータ
5.4 よりあいグループのデータは廻る
5.5 よりあいグループのデータの周辺
5.6 よりあいグループのデータを予測する
5.7 よりあいグループのデータで社会問題を解決する
6 おわりに;生活と社会の近未来
6.1 ほとんど色即是空・空即是色な(まばらでゆらぐ)世界
6.2 まばらでゆらぐ人びとの地域社会
6.4 データでつながる、地域のNPOから国際NGO連合まで
--------------------------------------

技術的な内容は、「ニュース屋台村」にはコメントしないでください。「株式会社ふぇの」で、フェノラーニング®を実装する試みを開始しました。











コメントを残す