Google Gemini実況中継(その1)
「帝国」の逆襲
『みんなで機械学習』第66回

7月 09日 2025年 社会

LINEで送る
Pocket

山口行治(やまぐち・ゆきはる)

o
株式会社ふぇの代表取締役。独自に考案した機械学習法、フェノラーニング®のビジネス展開を模索している。元ファイザージャパン・臨床開発部門バイオメトリクス部長、Pfizer Global R&D, Clinical Technologies, Director。ダイセル化学工業株式会社、呉羽化学工業株式会社の研究開発部門で勤務。ロンドン大学St.George’s Hospital Medical SchoolでPh.D取得(薬理学)。東京大学教養学部基礎科学科卒業。中学時代から西洋哲学と現代美術にはまり、テニス部の活動を楽しんだ。冒険的なエッジを好むけれども、居心地の良いニッチの発見もそれなりに得意とする。趣味は農作業。日本科学技術ジャーナリスト会議会員。

◆「Google帝国」の逆襲

前稿第65回(「IBMクラウド実況中継(その3) 生成AIがバカすぎて」https://www.newsyataimura.com/yamaguchi-148/#more-22431 )は「新たなデータの世界を探索するデータAIが、データ文明の入り口になるのか、生成AIが近代文明の言語資産を消費し尽くして衰退するのか、近未来への岐路は論理的ではなく、少なくとも4次元以上の高次元空間の想像力で、多数の入り口と出口を発見して冒険する必要がありそうだ」と結んだ。

生成AI(人工知能)の能力が急速に進化していて、人間を超えるASI(人工超知能)の出現が目前であることは、ソフトバンクの孫正義社長に教えていただかなくても「みんなの」実感に近い。前職で、創薬における技術革新を担当していた時に、自社の研究者や経営者にインタビューして、未来予測のありかたを考えたことがある。技術革新の方向性については、「みんなの」予想がほぼ一致していた。技術革新が実現する時期は、おおむねオプティミスティックだった。文化的に背景が異なる東洋医学などの未知技術については、「みんなの」予感は、まさにジョーカー(期待されない切札)でしかなかった。

「みんなの」未来予測は、みんなの未来への期待と不安なのだ。技術革新に関する専門家の未来予測を信じる前に、予測している未来は誰の未来なのか、よく考えるほうが良いだろう。医療の場合でも、本来は患者の未来のはずだけれども、医者の未来であったり、製薬企業の未来であったりする。多くの関係者の未来が、当事者の未来に影響を与えている。「みんなの」予感が、現時点での「みんなの」未来なのだ。

前稿で「データAI」と記述した技術は、Google傘下の英国ディープマインド社は「経験の時代」と呼んでいる(https://note.com/joyous_echium468/n/n3a5613672e43 )。人間がAIにデータを与えるのではなく(与えうるデータは、すべて与えてしまった)、AIが自律的にデータを取得して学習する仕組みを提案している。学習するのはAIが経験する「世界モデル」だ。

一見先進的な考えのようだけれども、哲学的には、デイヴィッド・ヒューム(1711~76年)を代表とする、英国の経験論哲学でしかない。経験論では、他者を経験できないため、独我論に陥りやすい。世界モデルも、人間中心の世界モデルとなるだろう。

ディープマインド社が本気モードになって、GoogleのAI戦略とAI製品群が圧倒的な強さを見せ始めた(「Google I/O 2025感想『帝国の逆襲!?』 Google AIが見せた底力」〈IT navi著〉)、https://note.com/it_navi/n/na9ebc380fdcb )。技術的には最先端で難易度が高いことはよくわかるけれども、「Google帝国」による「力ずく」という感じがする。

中国も帝国主義では負けていない。防犯カメラの画像やインターネットのデータで国民を監視する、共産党の独裁的な「経験の時代」では、Googleよりも先行している。AIビジネスは第3次世界大戦どころではなく、人工超知能(ASI)が出現する直前の、人類最後の戦いの様相だ。筆者としては、猿の惑星の住人の立場から、異次元のジョーカーを目指すことにしよう。

「データ文明」への出入り口を発見して冒険することに、なぜ4次元以上の高次元空間の想像力が必要なのか。AND・OR・NOTの(集合の関係を視覚的に表現する)ベン図のような、2次元での論理的説明で十分であれば、人工超知能が「データ文明」への入り口となる。しかし、単純に現在の近代文明が進化するとは思えないので、試行錯誤するための出口も用意しておきたい。

人工超知能の「世界モデル」は、少なくともアインシュタインの4次元時空をモデルに含むはずだし、量子力学の演算子を記述する無限次元空間もモデルに含まれる。アインシュタインの相対性理論と量子力学の関係は、単純な2次元の論理で説明できない。

そして何よりも、データの世界を巨大な2次元行列で表現できたとしても(AIのディープラーニングの世界は、巨大な3次元テンソルで表現されているけれども、技術的には巨大な2次元行列に展開しうる)、ほとんどの行列要素がゼロとなるスパースな行列であることは確かだ。スパース(疎)な行列であることを前提条件とすると、巨大な行列を縮約して、逆行列が計算できるようになり、人びとが理解できるデータの世界になる。

その縮約されたデータ行列が、4次元なのか10次元なのかはよくわからないけれども、筆者としては、5次元以上10次元以下を想像しながら、フェノラーニング®を構築している。

「力ずく」の「Google帝国」が行き詰まったとしても、ジョーカーの世界への出入り口を複数用意して、米国の思想家ナシーム・ニコラス・タレブ(1960年~)の反脆弱(ぜいじゃく)性という意味で、人びとが生き残る可能性を確保したいという、猿の惑星のサル知恵だ。

Google Gemini実況中継-1 猿の惑星かなりやばいかも

無料版のIBMクラウドでは、SPSS Modelerと生成AIを同時に立ち上げることができなかった。生成AIは、ChatGPTのようなチャットツールとして発展してきたので、データ解析を行うためには、SPSSなどの統計パッケージを使うか、RやPythonなどのデータ解析用のプログラム言語と組み合わせる必要がある。

筆者としては、SAS社のJMPなどの統計パッケージを使いたいところだけれども、高価だし、AI機能との連携がとても弱い。「みんなの機械学習」のために、RベースのJASPやJamoviを評価してきた。これらのRフロントエンド(UI/UX)では、データマネジメント機能が不十分であるため、IBMに買収されて生き残ったSPSSに戻る苦渋の選択をした。

GoogleのGemini 2.5-proが2025年5月のGoogle I/Oで発表され、順次、関連製品がリリースされている。筆者が日常的にGmailと共に使っているGoogleのクラウドサービスGoogle Workspaceで、最先端の生成AIであるGemini2.5-proを無料で試用できるようになった。

Gemini 2.5-proでは推論能力が大幅に強化された。そのおかげで、生成AIによるプログラム作成やデータ解析の能力が飛躍的に進歩している。Geminiのユースケースとして、Google スプレッドシートの分析が紹介されていた。そこで、拙稿第63回「IBMクラウド実況中継(その1)」(https://www.newsyataimura.com/yamaguchi-146/ )のSPSS Modelerで用いたデータをGoogle スプレッドシートで読み込んで、「このデータを分析してください」とプロンプトに入力した。ExcelやSPSSを想定したCSVファイルの読み込みは瞬時で完璧、分析は2分程度だった。データ以外の予備知識は全く与えていない。

Geminiのデータ分析は、驚くべきものだった。以下が、Geminiの解析報告の最初の部分だ。「これは、神経変性疾患に関連する可能性のある様々な臨床的および遺伝的マーカーを含むデータセットのようです。データセットには、以下のような列が含まれています。

DX_bl: 診断ベースライン

AGE: 年齢

PTGENDER: 性別

PTEDUCAT: 教育年数

FDG: FDG-PET スキャン結果

AV45: アミロイド PET スキャン結果

HippoNV: 海馬の脳容積

e2_1, e4_1, rs3818361, rs744373, rs11136000, rs610932, rs3851179, rs3764650, rs3865444: 遺伝子型情報

MMSCORE: MMSE スコア

TOTAL13: ADAS-Cog 13 スコア

ID: 被験者 ID

これらのデータからいくつかの分析を行うことができます。まず、主要な数値変数の分布とそれらの関係を調べて、データセットの初期の洞察を得ることから始めます」。

このデータはインターネットで公開されているデータであるため、多分Geminiはインターネット上の複数の論文やデータソースから、変数名とその内容を、あらかじめ学習しているのだろう。

添付した図は、解析の結論だ。この結論は、Gemini自身が導いたもので、結論の導出過程がグラフで説明されている。そのまま論文にするのには問題があるけれども、多分、筆者が1日かかる仕事を、2分程度で軽々こなしている。決定的なことは、このデータ解析を行った、Geminiが生成したPythonプログラムも表示が可能で、多少修正すれば、より高度な解析にも使える。筆者はまだこの機能を試していない。順次、実況中継しよう。

データマネジメントのための、SASやPythonのプログラムを作成する必要は、ほとんど無くなった。簡単な指示(プロンプト)を与えれば、GeminiがPythonのプログラムを作成してくれる。製薬企業の実務において、データマネジメントのためのプログラム作成には、データ解析のためのプログラム作成よりも3倍以上の労力が必要だ。医師や患者が報告するデータでは、欠測値や外れ値が多く、データをクリーンアップしてから、適切なコーディングをして、統計解析が可能なデータとなる。そのデータマネジメント業務を、生成AIが自動化しようとしている。

自社独自のデータの場合は、もう少し丁寧にデータを説明する必要がある。しかし、そのようなデータに関する説明は、標準作業手順書(SOP)や試験プロトコルを与えれば、Geminiが自動的に読み取るだろう。「みんなの機械学習」はGeminiが実現したのだろうか。

筆者が見ぬいたGeminiの限界、もっと強く言えば、現在のAI技術の限界は、「言語」のような、意味があるデータの解析しか自動化できないことだ。成功した試験のデータ解析はできる。しかし、失敗した試験のデータを解析して、なぜ失敗したのか、どのようにすれば同じ失敗は防げるのか、という洞察は得られないだろう。筆者が仕事とする医学薬学分野では、試験の大半は失敗なのだから、失敗から学べなければ、経済的にも大問題だ。

現在のAI技術の限界は、その数学的な原理、「ソロモノフ帰納」(※参考1)の限界でもある。近代科学は「普遍的」真理を前提としている。その場合は、データを最良に圧縮しうるプログラムが真理に近い。しかし、個体差が大きくて意味不明のデータの場合は、「圧縮」よりも直接的に、「予測可能性」に注目する必要がある。フェノラーニング®の理論の骨格が、ソロモノフ帰納の理論を批判的に検討することで得られるだろうという見通しを得た。そして、フェノラーニング®によるデータマネジメントの自動化によって、個人(個体)のビッグデータ活用が始まる。「みんなの機械学習」は始まったばかりだ。

◆閑話コラム記事6 哲学は「考えようもないことを引き受ける」

哲学の出発点が、ソクラテスを師とするプラトンであるとすれば、数学や自然科学は哲学として出発したことになる。哲学以前と哲学以降では、数学や自然科学の内容そのものは大きな変化が無かったとしても、未来に向けた探求の方向性は大きく変化したと思われる。

天動説から地動説への変化、それは神学から自然科学への変化だけではなく、近代文明を決定づける哲学の変化でもあった。そして、近代文明からデータ文明への哲学の変化が起こるとすれば、地動説ではなく、スケールフリーで運動や時間概念が「くりこまれる」(renormalized)または「入れ子になる」(nested)世界観への変革(超越)に相当する変化になるだろう。

現在でも、人間が経験しうる感覚としては天動説であることに変わりない。物理法則を理性で理解することで、地動説を受け入れている。しかし、現在の物理法則には致命的な欠陥がある。宇宙規模の時空間を記述するアインシュタインの相対性理論と、物質の微細構造を記述する量子論が統合されていない。おそらく、相対性理論は近似的な理論で、量子論がブラックホールも含めて宇宙の構造を記述するより良い理論と思われるけれども、量子論における時間や空間の概念、さらに因果関係の概念は、近代哲学の守備範囲では理解不可能だ。

「考えようもないこと」は現実に存在する。ソクラテスが、無知の知、「知らないことを知っている」という弁論術で言いたかったことは、知っていることが1%で、99%を知らないということではなく、99%は知りえないことで、1%の知恵でいかに生きてゆくのかということなのではないだろうか。ソクラテスの発見が素晴らしすぎたため、ソクラテスは死刑になる。

近代文明は市民的「自由」の時代でもあった。近代の自由の扉を開いたのは、17世紀オランダの哲学者スピノザだ。スピノザの自由は、神の国で人びとの自由意志が否定された「ありえない自由」だった。仏教の世界観には、曼荼羅(まんだら)に見られる「入れ子」構造が、明確に反映されている。西欧文明の「世界モデル」ではない、ジョーカーの世界のほうが、データの世界に近い可能性が大きい。データ文明の観点では、現在の経済学や政治論は、中世の神学程度の、近代の「世界モデル」でしかない。

賢すぎるAIの「世界モデル」も、同レベルだろう。「世界モデル」など気にしない、バカすぎるAIのほうが、データ文明にはふさわしい。データには善悪も、バカか賢いかも、人間的な価値観は無関係で、データを利用しようとする人間が、意味や価値を付与しているのに過ぎない。データ文明にも哲学は必要なはずだけれども、近未来の哲学は、天動説も地動説も否定する、入れ子の世界なのかもしれない。「考えようもない」ことを考える哲学者は、バカすぎる。

◆閑話コラム記事7 ブレーキとアクセルだけではなく、クラッチを操作するAI

筆者はクラッチ付きの軽トラックを運転している。最近では、エンジンの性能が良くなったのだろうか、オートマの軽トラもある。軽トラのクラッチは、4輪駆動や、ぬかるみでのスーパー低速ギアなど、軽トラ独自の機能と関係している。クラッチがついているマニュアル車の運転者は、坂道発進だけではなく、道路の状況判断をしながら、最適なギアを選択する必要がある。

筆者は高齢者ドライバーなので、追突防止などの安全機能を装備する「サポカー」も運転している。この「サポカー」も軽自動車なのだけれども、ターボ付きでオートマだ。オートマであっても、マニュアルでギアを設定することはできるけれども、燃費の最適化などの機能がうまく動作しなくなる。ギアを変えてエンジンブレーキをかけるのではなく、ハイブリッドのモーターで充電することを想定しているからだろう。実際は、99%オートマで運転している。

運転者の実感としては、最新の「サポカー」の安全機能よりも、ポンコツ軽トラのマニュアル運転のほうが「安全」だと思う。軽トラでも、5速のギアで時速100キロ以上で運転できる。軽トラで5速のギアを使う状況判断と運転技術が前提条件だ。アクセルを踏めば、簡単に時速100キロになる高性能のマニュアル車とは別世界だ。

AIが状況判断をして、クラッチ操作をするAIマニュアル車を考えてみた。道路の制限時速に対応してギアを最適化すれば、現在のオートマ車よりも、多少は安全になるだろう。そして気がついたことは、AI自体にクラッチをつければ、AIが安全になるかもしれないということだ。現在の生成AIでは、課金モードに応じて、応答スピードを調節している。一種のギアチェンジかもしれないけれども、オートマの世界だ。クラッチのように、一瞬にしてエンジンから動力源をデカップル(分離)してしまうという、超越的な機能はない。筆者としては、軽トラのような、クラッチ付きで、バカすぎるAIを楽しく、「安全」に、乗りこなしたい。

◆閑話コラム記事8 マネーの原点はマネーロンダリングかもしれない

カール・マルクス(1818~83年)の「資本論」の骨格になっている、使用価値から交換価値へという、貨幣の理解は、19世紀産業社会の制約があるのだろう。歴史的に見れば、物々交換は限定的で、貨幣は貸借のための「信用」記録として使われたのかもしれない。いずれにしても、マネー(銀行券)の表面的な姿だ。

養豚業者はブタを売らないと生活できない。軍人も、戦地で活躍するよりも、給与を得るほうが重要だろう。労働をマネーに変換することで、生活から労働を切り離すことがマネーの重要な機能なのかもしれない。狩猟・採取の時代のように、生活と労働と祭りが混然として切り離されていなかった時代には、マネーは必要なかったのかもしれない。

マネーには、常に犯罪がつきまとう。犯罪で得たマネーを、出所がわからないようにして、自由に使えるようにする技術、マネーロンダリングには銀行の役割が不可欠だ。銀行とはいっても、暗号資産のようなデジタル技術も含めると、マネーロンダリングは無限に近い可能性がある。サイバー空間での犯罪を取り締まれないのであれば、マネーロンダリングを取り締まることは、ほぼ不可能だろう。

マネーの原点がマネーロンダリングだとすれば、マネーに関わる犯罪が無くならないことはよくわかる。犯罪はマネーよりも原初的で、マネーが無くなってとしても、犯罪はなくならないだろう。それでも、マネーが、交換価値や信用などという、善良な表の姿だけではないということを理解すれば、暗号資産などの、新たなマネーへの幻想を修正することはできるかもしれない。

弱肉強食で生きている動物たちには、マネーロンダリングはない。動物よりも高等な植物にも、もちろんマネーロンダリングはない。しかし、動物たちや植物にも、自然界のルールはあって、ルールに従わない偶然の事件もあるのだろう。

マネーロンダリングを必要としない、マネーの世界はどのような世界なのだろうか。株式市場だけではなくて、労働市場も含めて、市場における価格形成が、「天気予報」程度には予測可能になる世界、「神の見えざる手」ではなく、AIの予測が公知となる近未来において、ブラックマネーから透明なマネーへ、マネーの世界が大きく変革されることを夢見ている。その変化は、必ずしも心地よいものではなかったとしても、居心地の悪い政治経済に支配された世界が、よりスパース(疎)で透明な世界になるかもしれない。

※参考1:Solomonoff,R.J.(1964)”A formal theory of inductive inference. Part 1.”Information and Control,7(1),1-22.

--------------------------------------

『みんなで機械学習』は中小企業のビジネスに役立つデータ解析を、みんなと学習します。技術的な内容は、「ニュース屋台村」にはコメントしないでください。「株式会社ふぇの」で、フェノラーニング®を実装する試みを開始しました(yukiharu.yamaguchi$$$phenolearning.com)

コメント

コメントを残す