G検定の学習として、今回は方法論のベースになる部分を勉強していきます。
技術的な問題は、ディープラーニングなどの登場により、段々と解消されていますが、
同時に倫理的問題も顕著になってきています。
G検定の概要はこちらに書いていますので、G検定に興味があれば、こちらも御覧ください。(2020年6月26日(金)まで、7月のG検定受験料半額キャンペーン中です。)
トイプロブレム
現実の問題を簡素化してコンピュータに扱わせるというのがこのトイプロブレムです。
本質部分を残すので、問題の本質理解や練習、アルゴリズムの性能比較に用いられるものですが、
第1次AIブーム(1950年代後半〜1960年代)の頃に数学の証明や迷路やパズルを解くなどがされましたが、「現実で起こる問題には対応できないじゃん」ということになり第1次ブームが収束していきました。
フレーム問題(人工知能研究の最大の難問)
人工知能研究の最大の難問とも言われている問題です。
「今しようとしていることに関係のある事柄だけを選び出すことが、実は非常に難しい」ということを指しています。
1969年にジョン・マッカーシーとパトリック・ヘイズが提唱し、未だに本質的解決はできていません。
フレーム問題(ロボットの例)
哲学者のダニエル・デネットが、ロボットと洞窟と爆弾の例でフレーム問題を説明しています。
例:洞窟の中に台車があり、台車の上にバッテリーと時限爆弾がある。そこからバッテリーだけを持ち出すようにロボットに指示を出してみる。
1号は、台車ごと持ち出してしまい、ロボットごと爆発。
2号は、自分が行った行動結果を副次的に何が起きるかを考慮するようにしてみたところ、洞窟の中で持ち出すかどうかの計算中に爆発。
3号は、目的を遂行する前に目的と無関係なことを考慮しないように改良されたところ、持ち出す方法の計算方法の計算中に爆発。
つまり、関係のあることだけを選び出すことがいかに難しく、解決できないかがここからわかります。
チューリングテスト
チューリングテストは、人工知能ができたかどうかを判定する方法です。
アラン・チューリングが提唱し、別の場所にいる人間がコンピュータと会話をし、相手がコンピュータだと見抜けなければコンピュータには知能があるとするものです。
実際、人間がコンピュータだと見抜けないこともあり、1991年以降はこのチューリングテストに合格する会話ソフトウェアを目指すローブナーコンテストが開催されています。
強いAI・弱いAI
もともと、アメリカの哲学者ジョン・サールが1980年に発表したもので、以下のように区分をしました。
強いAI
適切にプログラムされたコンピュータは人間が心を持つのと同じ意味で心を持つ。また、プログラムそれ自信が人間の認知の説明である。
→ 本物の心を持つ、ドラえもんみたいな人工知能はコンピュータで実現できるという区分のことです。ジョン・サールは、「強いAI」は実現不可能だと主張しています。
そのために、「中国語の部屋」という実験を提案しています。
中国語の部屋
- ある部屋に英語しか分からない人が閉じ込められる。
- 部屋の中には、中国語の質問に完璧に答えられるマニュアルがあり、それを使えば完璧な受け答えができるとする。
- すると、部屋の外から来た中国語の質問に対してマニュアル経由で答えを出すとすると、部屋の外の人は中の人が中国語を理解しているように思う。
- しかし実際には部屋の中の人は英語しか理解していない。
ここから、まるで知能があるような受け答えをしているようでも実際に知能があるかどうかわ分からないという議論です。
ジョン・サールは、コンピュータは記号操作を行っているだけで心にとって本質的な意味論を書いていると主張しました。
数学者のロジャー・ペンローズも『皇帝の新しい心』で既存のコンピュータでは強いAIは実現しないと主張。
弱いAI
コンピュータは人間の心を持つ必要はなく、有用な道具であればよい。
→ コンピュータは人間の心を模倣するだけで本当の心を持つことはできない。人間の知能活動と同じような問題解決ができる便利な道具であればいいという区分のことです。
シンボルグラウンディング問題
フレーム問題同様に、人工知能の難問の一つ。
シンボルグラウンディング問題は、認知科学者のスティーブン・ハルナッドによる議論されたもので、記号(シンボル)とその対象が以下にして結びつくかという問題のことです。
「シマ」と「馬」と「シマウマ」の関係。
コンピュータは、記号(文字)の意味がわかっていないので「シマ」と「馬」が分かっていても「シマウマ」という記号(文字)とそれが意味するものが結びついていない(グラウンディングしていない)。
これがシンボルグラウンディング問題です。
ディープラーニングの登場で克服されつつある。
知識獲得のボトルネック
機械翻訳
1970年代後半は、ルールベース機械翻訳、1990年代以降は、統計的機械翻訳が主流になっています。
だが、ここまででは実用のレベルではありません。
文章は経験則によって文脈の認識が異なることがあるからです。
He saw a woman in the garden with a telescope.
この文章は、庭にいるのが女性なのか、彼なのか、望遠鏡をもっているのが女性なのか彼なのかを決めることができません。
これをコンピュータが判断するのが困難、コンピュータが知識を獲得することの難しさを、知識獲得のボトルネックと呼びます。
最近は、Google翻訳やDeepLなどの翻訳で、ディープラーニングを使ったニューラル機械翻訳が使われるようになり、知識獲得のボトルネックを乗り越えつつあります。
特徴量設計
機械学習は、注目すべきデータの特徴の選び方が性能を決定付けます。この特徴を量的に表したものを特徴量といいますが、特徴量の選択は人間が行わなくてはいけませんでした。
ただ、この特徴量を機械学習自身に発見させればより良さそうです。このことを、特徴表現学習と呼ばれています。
ディープラーニング
ディープラーニングは、この「特徴表現学習」を行う機械学習アルゴリズムの一つで、与えられたデータの特徴量を階層化し、それらを組み合わせることで問題を解きます。
また、ニューラルネットワーク自身が複数ステップのコンピュータプログラムを学習できるということも言えます。
特徴量は、入力データとは無関係で、与えられた問題を解くために必要な処理(プログラム)に役立つ情報として抽出されている事になり、
自動で機械が抽出してくれるということは、
特徴量になった判断理由が示せない、ブラックボックス型の人工知能とも言えます。
シンギュラリティ
シンギュラリティ(技術的特異点)についての研究者の意見をまとめます。
レイ・カーツワイル
人工知能が十分に賢くなり、自分自身よりも賢い人工知能を作るようになった瞬間、無限に知能の高い存在を作るようになり、人間の想像力が及ばない超越的な知性が誕生するという仮設のことです。
レイ・カーツワイルはこれが2045年に来ると言っており、
更に「人工知能が人間よりも賢くなる年」は2029年であると言っています。
スティーブン・ホーキング
完全な人工知能を開発できたら、それは人類の終焉を意味するかもしれない。
イーロン・マスク
人工知能にはかなり慎重に取り組む必要がある。結果的に悪魔を呼び出していることになるからだ。ペンタグラムと聖水を手にした少年が悪魔に立ち向かう話をご存知だろう。少年は必ず悪魔を支配できると思っているが、結局は出来はしないのだ。
ビル・ゲイツ
私も人工知能に懸念を抱く側にいる1人だ。
参考資料
深層学習教科書 ディープラーニング G検定(ジェネラリスト) 公式テキスト (日本語) 単行本(ソフトカバー)
徹底攻略 ディープラーニングG検定 ジェネラリスト 問題集 徹底攻略シリーズ Kindle版