文系だから数学はわからない、と敬遠してきたビジネスパーソンはいないだろうか。だが、AI(人工知能)がビジネスや日常生活に活用される時代。AIが判断の拠り所にしている数学の素養があれば、怖くない。
本書「文系でもわかるAI時代の数学」(祥伝社新書)が、扱うのは「統計」「微分積分」「線形代数」「トポロジー」の4分野。いずれも難解な数式を解く必要はなく、数学者のエピソードや身近な例で解説された概念を知るだけで、AI時代を生きる知識が得られるだろう。
「文系でもわかるAI時代の数学」(永野裕之著)祥伝社新書
著者の永野裕之さんは、永野数学塾塾長。東京大学理学部地球惑星物理学科卒業。同大学院宇宙科学研究所(現JAXA)中退。著書に「とてつもない数学」「ふたたびの高校数学」などがある。
統計が明らかにする、意外なものの相関関係...「紙おむつと缶ビール」
ところで、4つの分野の数学的思考を身に付けることで、どんなことが可能になるのだろうか? 永野さんは、以下のように説明している。
(1)統計 宝の山(ビッグデータ)から意味のある有益な情報を導き出す方法
(2)微分積分 予想と実際の値のずれを調べ、その誤差を小さくする
(3)線形代数 膨大な計算式を簡潔にして、効率よく大量の知識を学習させる
(4)トポロジー 画像解析と繋がりの可視化に生かされる「新しい図形の見方」
まずは、(1)「統計」を中心に概観してみよう。
統計は、数字の羅列の中から意味のある有益な情報を導き出す手法だ。AIは、宝の山であるビッグデータから本当に必要な、そして正しい情報を引き出すために、絶えず大量の数値に統計的な処理を行っている。
世の中にデータマイニングの事例を最初に紹介したのは、1992年の「ウォールストリートジャーナル」に掲載された以下の記事だという。
「アメリカ中西部の小売ストア・チェーンOsuco Drugsは、25店舗のキャッシュレジスターのデータを分析したところ、ある人が午後5時に紙おむつを買ったとすると、次にビールを半ダース買う可能性が大きいことを発見した」
この記事は「紙おむつと缶ビール」という意外な組み合わせに相関関係があることがわかった、ということで大きな話題になり、今でもデータマイニングの有効性を示す例として、しばしば引用されるという。
相関関係を調べる手法は、大きく分けて2つある。1つは、散布図という図を書いて図の印象から判断する方法。もう1つは、相関係数という値を計算して、数値で判断する方法だ。
2つの量の組み合わせを座標として扱い、座標軸上に書いていく。散布図の点が右上がりに分布しているときは、正の相関係数があると言える。一方、右下がりに分布しているときは負の相関関係がある。
その判断は、感覚に頼らざるを得ないので登場するのが相関係数だ。
その求め方を紹介した上で、「1」に近ければ近いほど強い正の相関関係、「-1」に近ければ近いほど負の相関関係がある。また、相関係数が「0」に近いときは相関関係がないと判断する。
プロ野球・投手の年間成績、「勝利投手」になるのは運の要素大きい?
たとえば、プロ野球で活躍する投手の年間成績についての相関係数は、奪三振率は0.7程度であるのに対して、勝率は0.2程度だという。奪三振率は実力の要素が大きいのに対し、勝利投手になれるかどうかは運の要素が大きいからだ、と説明している。
裏を返せば、いくら実力があっても毎年高い勝率を残すのは至難の業、ということ。それができる各チームのエース級のピッチャーは、運の要素をものともしない抜きんでた実力の持ち主だとも。
次に、確率分布、「たとえ母集団がいかなる分布であっても、サンプルとして集めた数値の個数が多ければ多いほどそれらの平均は正規分布に近づく」という中心極限定理、仮説検定について説明している。
「失われた30年」の間に日本の国力が著しく下がってしまった大きな要因の1つは、統計教育の遅れだ、と指摘している。最近、日本でも「データサイエンス学部」が次々に設立されているが、アメリカでは統計学の修士が年間5000人も輩出しているそうだ。
本書で扱っている4分野の中でも、統計がもっともビジネスパーソンにとって、とっつきやすく、仕事に役立ちそうに思われた。
AIの画像認識の技術に貢献する「トポロジー」とは何か
では、残りの(2)「微分積分」、(3)「線形代数」、(4)「トポロジー」も順にみていこう。
(2)「微分積分」もAIに活用されている。
AIは、人間の指示を待つことなく、ひとりでどんどん「学習」する。何を学習するかと言うと、自らがはじき出した予想と実際の値がどれくらいずれているかを調べ、その誤差をできるだけ小さくするためには、どの入力値を重要視すべきを学習する。
多くの場合、誤差は「目的関数」と呼ばれる関数として表される。誤差が最も小さくなるのは、この関数の値が最少になるときで、その点における関数のグラフの接線の傾きは0になる。微分とはある点におけるグラフの傾きを求めたり、グラフの概形を捉えたりする計算だ。
また、距離や時間のような連続量と呼ばれる数値に関する確率を求めるには、「確率密度関数」と呼ばれる関数のグラフと横軸で挟まれたある区間の面積を求める必要があり、それには積分が使われる。
(3)「線形代数」は、連立方程式をシステマチックに解くための手法だ。
中学で学んだxとyの連立方程式は、未知数の数が2つしかないので、簡単に解けた。線形代数にはどんなに未知数の数が増えても連立方程式を型通りに解く手法がある。
ベクトルや行列の基礎を解説し、これらを使うと、複数の数式が1つにまとまり、簡略化されるのでプログラムも簡潔になる。これが、AIには好都合だ。AIにとって線形代数は「もっともわかりやすい言葉」である、と説明している。
(4)「トポロジー」は、新しい図形の見方だ。
「やわらかい幾何学」と呼ばれることもあるトポロジーの世界では、図形を自由に伸びるゴム膜でできているものと考え、引っ張ったり、ぐにゃぐにゃに曲げたりして、コーヒーカップとドーナツのようにまったく違って見える図形どうしも「同じ」にしてしまう。
「同じ」を拡大解釈し、図形を抽象化するトポロジーの研究は、AIの画像認識の技術に大きく貢献しているという。
ここでは、AIとの関連を中心に述べたが、主な概念について、参考書的に数式や図を使って解説しているので、それぞれの分野の入り口までは到達できるだろう。(渡辺淳悦)
「文系でもわかるAI時代の数学」
永野裕之著
祥伝社新書
1034円(税込)