2回転目チェックは特許データのダウンロード
『みんなで機械学習』第5回

3月 15日 2021年 社会

LINEで送る
Pocket

山口行治(やまぐち・ゆきはる)

o株式会社Aデコード研究所設立準備中。元ファイザージャパン・臨床開発部門バイオメトリクス部長(臨床試験データベースシステム管理、データマネジメント、統計解析)。ダイセル化学工業株式会社、呉羽化学工業株式会社の研究開発部門で勤務。ロンドン大学St.George’s Hospital Medical SchoolでPh.D取得(薬理学)。東京大学教養学部基礎科学科卒業。中学時代から西洋哲学と現代美術にはまり、テニス部の活動を楽しんだ。冒険的なエッジを好むけれども、居心地の良いニッチの発見もそれなりに得意とする。趣味は農作業。日本科学技術ジャーナリスト会議会員。

『みんなで機械学習』の2回転目は、CAPDサイクルのチェック(C)フェーズから始まる。今回は無料のデータを大量に取得してみよう。インターネットの特許検索サイト(PATENTSCOPE)において、機械学習を使ったビジネス関連特許を検索すると、6042件ヒットした。具体的には(“machine learning”AND G06Q)で検索している。G06Qはビジネス関連特許に相当する 国際特許分類コード(IPC code)だ。この6042件の特許データ(例えば、出願年、出願国、出願者、タイトル、アブストラクトなど)をダウンロードして機械学習してみよう。機械学習しなくても、出願国は1位中国、2位米国で、出願者は1位マイクロソフト、2位IBMなどという単純な統計はPATENTSCOPEの機能ですぐにわかる。しかし、中小企業経営者にとって役立ちそうなビジネス課題を6042件から探すのは容易ではない。

“machine learning”で検索すると3万4422件ヒットする。機械学習の技術は2001年ごろから特許出願されるようになり、2016年以降急速に増加した。機械学習に関連したビジネス関連特許は2004年ごろから出願されるようになり、2017年以降急速に増加した。ビジネス関連特許の出願が多少遅れているが、機械学習がビジネスモデルに大きな影響を与えることは、当初から想定されていたことがわかる。例えば車の製造の場合、車の使用状況のデータを使って、安全運転や電池の節約をサポートする技術が出願されている。作るだけの製造業から、機械学習による使用サポートも含めたサービス業への展開が可能になってきた。ビジネスモデルにおいて、機械学習は自動販売機以上のインパクトがあることは確実だろう。ビジネス関連特許の場合、ビジネスを独占する目的ではなく、他社による独占を防止したり、自社技術の販売を有利にしたりする防衛的な出願が多い。しかし機械学習の技術が、ビジネスにおいてどのような応用があるのか、6042件の具体的な事例から学習する価値は大いにある。

特許を機械学習するプログラムとして、電力中央研究所が開発した独立話題分析のプログラムを使ってみた経験がある。テキストマイニングの応用技法だ。日本特許の場合、要約の「課題」と「解決手段」に注目すると話題(トピック)を抽出しやすい。ある程度の数のトピックであれば(例えば100件程度)、統計的な手法を工夫して、特定のビジネスモデルにとって興味深い特許を抽出することは可能だろう。特許の場合、国際特許分類コードを使えば、特許専門家がトピックの大まかな分類をしてくれているので、テキストマイニングを行わないでも入門的な解析ができる。次回のアナリシス(A)フェーズでは国際特許分類コードを分析してみる。以下のJamovi出力は、実際に6042件の検索結果を読み込んで、出願年などを多少データマネジメントして(日付の文字型変数から年データを数値として抽出)、中国、米国、日本での特許出願に限定(フィルタリング)したものだ。米国では1999年から機械学習のビジネス関連特許が出願され、2015年以降急速に増加している。日本は米国に追従しているけれども、出願数は13%程度しかない。中国は1年ほど遅れて追従していて、出願数は米国を追い抜いた。

CAPDサイクルのCとAのフェーズはAI(人工知能)が担当し、「みんな」で機械学習を行うPlanとDoのフェーズでは、中小企業経営者らしい独自の発想が求められる。例えば(“machine learning” AND fruits)で検索すると、中国4件、米国4件、インド3件、国際出願1件の合計12件がヒットした。内容は様々だけれども、一読して全体像がつかめる。すべてが大規模農業経営関連だ。(“machine learning” AND Cocktail)では4件すべてが医薬品のカクテル(混合製剤)で、酒場のカクテルでは機械学習されていないようだ。(“machine learning” AND sleep)では71件のほとんどが健康関連であることが国際特許分類コードですぐにわかる。例外は機械のスリープモードだった。(“machine learning” AND “lunch boxes”)では、1件だけ韓国特許がアトピー対策として出願されていた。弁当屋さんにも、機械学習関連の特許を出願するチャンスはある。特許としては先願がない、最初の特許も魅力がある。自社ビジネスに関連のあるキーワードを(“machine learning”AND G06Q) 6042件の特許から探索して、先願されているキーワードと、先願されていないキーワードに分類して、その境界当たりが「のりしろ」として興味深いだろう。

『みんなで機械学習』は、何でもAIが解決すると信じる強いAI主義者ではない。しかし気候変動のように、解決しなければならないけれども、解決が困難な社会課題やビジネス課題はいやなほどたくさんある。これらの問題群のうち、技術的な問題は技術で解決したい。単純な技術的解決が困難な場合は、別の技術(例えばAI技術)で問題を塗り替えてみてはどうだろうか。より問題が大きくなるかもしれないけれども、少なくとも初期の問題は小さいはずだし、視点が変わることは確かだ。そして「のりしろ」を発見することができれば、AI技術で問題群または解決方法の最適な組み合わせを探索してみよう。ヒトでは100のトピックの探索が限界だとしても、AIでは100x100x100の組み合わせなど全く問題ない。「のりしろ」として、自社ビジネスの境界が10個程度発見できたとして、その組み合わせ最適化をAIで行うことが『みんなで機械学習』の作戦だ。「のりしろ」の発見を周辺主義(marginalism)と名付け、ビジネス内部での組み合わせ最適化による新ビジネスの創出、または社会課題の解決をめざしたい。

--------------------------------------

『みんなで機械学習』は中小企業のビジネスに役立つデータ解析を、オープンソースの無料ソフトjamoviでみんなと学習します。質問があっても、絶対にニュース屋台村にはコメントしないでください。株式会社Aデコード研究所(設立準備中)でjamoviと本稿の続き(4回転半の後)をサポートする予定です。

コメント

コメントを残す