世界経済評論IMPACT(世界経済評論インパクト)

No.3596
世界経済評論IMPACT No.3596

見たくないものは報道されない

鶴岡秀志

(元信州大学先鋭研究所 特任教授)

2024.10.28

 株式証券市場関係者とメディアは,生成AIと関連する半導体市場に対してネガティブな情報は完全無視をするらしい。情報を歪めていて健全な産業経済発展に障害となっているのではないか。

 生成AIから得られる応答の検証とメディアを中心に語られているシンギュラリティ(特異点)に到達するというテーマについて検証した論文が10月7日に発表された(論文のWEBサイトはこちら:arXiv: 2410.05529v1)。本論文はApple社内外の専門家による指導で3名のApple社のインターンが行った研究成果をまとめたものである。我が国ITmedia NEWSが“「現在のLLMに真の推論は困難」ーAppleの研究者らが論文発表”(10月13日付)と題し概要を報じている。インターンといえどもApple社クラスになると新進気鋭の若い優秀な頭脳が集っている。取るに足らない事象でも大騒ぎをする主要メディアはこの論文を取り上げていない。

 arXivは米国コーネル大学図書館が運営している理系論文を中心とした投稿サイトである。査読無しでいち早く研究成果を発表できる場なので,時々刻々研究成果が出てくるITやバイオ分野の研究者にとって「一番乗り」を主張できる発表の場である。さらに,同じ分野の研究者にとってはいち早く研究分野の進捗を知ることができる有益な情報ソースである。査読無しというと玉石混交の論文が山のように投稿掲載されているように思われるが,明らかに荒唐無稽な内容は管理運営者により棄却されている。さらに,関連分野の多くの研究者が意見や反論,誤りを指摘できるので,投稿する研究者らは有名論文誌以上に発表内容の緻密さや厳密さを求められるため総じて論文の質が高い。このサイトでボコボコに批判されてしまうと研究者として失格となりかねない。そのため,投稿論文内容に“比較的近い”数人の査読者が審判する通常の主要論文誌より有用な論文が多い(Nature掲載論文の半分以上は再現不能という報告がある)。

 本論文において生成AIの能力の検証に使用された方法については,本論文またはITmedia NEWSが簡潔に概要をまとめているので参照していただきたい。本論文の目的である生成AIの創造性についてはCognition・Cognitiveという英単語がキーワードである。本論文で検証に使われた代表的な「例題」については,キーワードを念頭に置いて注意深く読み込まないと生成AIの問題点・追求ポイントを見逃してしまう。本文中の「例題」の他にAdditional情報として公開されているので相当な労力をかけた検証研究であるということが判る。この前提で本稿を読み進めていただければ幸いである。

 本論文のポイントは,

  • (1)質問や要求項目を数値に変換してデータベースと比較する方法を定めた生成AIのプロトコール,すなわち事象の判定基準に使われている数式は未知のことや複雑な要求項目について,人間が演繹するような「想定」ができない。
  • (2)生成AIに「学ばせる」様式(=プログラミングで定められたプロトコール)によって生成AIの応答が決められている。つまり,プロトコールという「前例踏襲」式なので前例にないものに対しては回答が曖昧か間違える(筆者注;Open AIはネットに存在していない情報については扱えないと言っていることを量的に示した)。
  • (3)数字を変更したり同義語に変えたりすると異なった答えが出てくる,または明らかに間違った答えが出てくる(筆者注;プログラミングを研究していた経験から言うと,数値のオーバーフローまたは「ゼロで割る=無限大」が生じる場合,計算が停止することを避けるために適当な数字を当てはめる,または数学的ノイズ処理で生じる複素数の虚数部分の処理がうまくできないので切り捨てることによって発生する現象と予想する)。
  • (4)Cognitionを人間のようなレベルまでに引き上げなければ創造性は生まれない(筆者注;CognitionとRecognition は日本語訳ではどちらも認識であるが,前者が心の中で知識と理解が発達する過程であることに対し,後者は存在するものを受け入れることという違いに留意しなければならない)。

 簡単に言うと,現在の生成AIは人間のように想像的に思考することができないということである。もう少し砕けた表現だと,生成AIの応答は役所が奉じる前例主義的なものということである。役所の仕事の合理化には非常に有効なシステムと言える。

 筆者も生成AIを重宝して使っているが本論文の指摘する点で得心する事がある。生成AIに画像作成を指示するにはセンテンス(言葉)を入力するか,既存の画像をアップロードして変更点を言葉で指示する方法を使う。前者のセンテンス入力を使う場合,単語を並べるとそれなりに「らしい」ものが出力されるが,バックグラウンドはなぜかサイケデリックにケバく暗い宇宙的な空になる。センテンスを長くするとかなりの頻度でこちらの意図とは違った理解に苦しむ画像になる。

 本論文はGSM8Kという2021年にOpen AIが提唱した生成AIを評価するための数学的ベンチマークを使ってquantitative(量的)に検証,説明している。今年の夏前に,Open AIはChat GPTの最新版発表の際にGSM8Kはもはや判断基準にならないと説明していたが量的説明は行っていない。逆に本論文は綿密に量的評価を加えているので,科学的検証の観点からはOpen AIの主張を覆している。

 拙著「Sci & Eng’s Eyes」(『世界経済評論」,2024年3/4号),で述べているように,生成AIは魔法でもなんでもなくて,あくまでも数式,特に不等式で示される判断基準アルゴリズムを使ってプロトコールを決めている。各生成AIについてプロトコールの詳細は開示されていないが,おそらく,数式の係数(パラメータ)を学習によって調整する自動修正システムを用いていると考えられる。この手順そのものは,フィードバックループなどでかなり昔から使われている手法であり,あくまでも「過去」と「現在」の差分による「学習」に基づく。この方法によって「一対一対応」のRecognitionはできるが,記録されていない様々な事象を「多対多対応」的にCognitionしている人間とはかなり乖離している。なお,フィードフォーワードという数学的には未来を予測する方法があるが,数学で使う意味のシンギュラリティに遭遇すると「発散」してしまい計算不能となるので工学的に使われている例は非常に稀である。

 前述拙著でも指摘しているが,生成AIが人間と同等になると巷で言われている意味の「シンギュラリティ」を超えるには数学の「群論」を処理できなければならない。本論文の内容から推察すると,現在の生成AIは既存の論文や教科書の記述データからごく簡単な「群論」を解くことは可能であるがあくまでも「前例」踏襲である。「群論」を使った想像的発展は前例が存在しないので取り扱えない。生成AIは莫大なエネルギー消費の問題を解決することと並行してCognitionを可能にする新たな数学の開発を進めていく事が必要と言える。

 翻って,主要メディアや金融関係の業界は,明らかに半導体・IT関連株価にとってネガティブな,見たくないものは一切報じないという姿勢が表れている。日経新聞電子版などでは,市場はいいとこ取り過剰ではないかと時々指摘をしているが,本論文を吟味すれば巷に溢れる生成AI 産業勃興論の見直しや生成AI礼賛は立ち戻って評価し直す必要がある。しかし,番組制作者の描いたストーリー通りの「絵」を取るだけの媒体になっているTVの姿を見れば,情報を公平,正確に伝える機能は失われていると言って良いだろう。我が国政府が推進する貯蓄から投資への転換で加熱する金融市場の動向は国というシステムの将来を予測するものではなくなっている可能性が高い。失敗を招かないために我が国経済産業を指導する人々は見たくないものをより熱心に見る必要がある。

(URL:http://www.world-economic-review.jp/impact/article3596.html)

関連記事

鶴岡秀志

最新のコラム