安敦誌


つまらない話など
by antonin
S M T W T F S
1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30
検索
最新の記事
サンセット・セレナード
at 2017-04-12 23:17
水分子と日本人は似ている
at 2016-06-04 01:49
ほげ
at 2015-06-05 03:46
フリーランチハンター
at 2015-04-17 01:48
アメリカのプロテスタント的な部分
at 2015-04-08 02:23
卯月惚け
at 2015-04-01 02:22
光は本当に量子なのか
at 2015-03-17 23:48
自分のアタマで考えざるを得な..
at 2015-03-06 03:57
折り合い
at 2015-03-01 00:19
C++とC#
at 2015-02-07 02:10
記事ランキング
タグ
(295)
(146)
(120)
(95)
(76)
(64)
(59)
(54)
(45)
(40)
(40)
(39)
(32)
(31)
(28)
(27)
(25)
(24)
(22)
(15)
最新のコメント
>>通りすがり ソ..
by Appleは超絶ブラック企業 at 01:30
>デスクトップ級スマート..
by 通りすがり at 03:27
7年前に書いた駄文が、今..
by antonin at 02:20
助かりました。古典文学の..
by サボり気味の学生さん at 19:45
Appleから金でも貰っ..
by デスクトップ級スマートフォン at 22:10
以前の記事

人工知能について

googleで検索をすると、検索結果に添えて検索に要した処理時間が表示される。これはおそらく、検索結果の表示に時間がかかったとしても、それはネットワーク遅延やブラウザのレンダリング時間のためで、googleがデータベース検索する時間はこんなに短いんですよという表明と、それから開発者の自尊心によるものなのだろうと思う。この検索時間と、検索内容の正確さというか妥当性を見て、これは実用的な連想記憶が実現した形なんじゃないかということを感じた。

連想記憶というのはスクリプト言語の連想配列に似たもので、通常の検索のように単純なキーを入力として複雑なパターンを出力するのではなくて、複雑なパターンを入力として別の複雑なパターンを出力するような情報の格納と呼び出しを実現する記憶方式ということになっている。そして、自由な文字列から複数のウェブページを呼び出すgoogleの検索は連想記憶の一種と言える。そして重要なのは、その呼び出し時間が10ミリ秒から数百ミリ秒という時間で完了しているところにある。

それに加えて、こちらはかなり明らかなことでもあるけれども、googleが検索対象として記憶しているウェブページの数というのは膨大なものになっている。結果として、膨大な記憶の中から互いに関連した情報を百ミリ秒オーダーで連想検索することが可能なデータベースが、すでにこの世界には存在しているということが言える。また、googleの検索では画像や動画なども検索可能になっている。この検索技術を少し応用して作られた日本語入力システムを私も利用させてもらっているが、従来型のIMEとは質的に異なる、非常に高い精度の変換ができるようになっている。

従来型というと、従来の未来予想図にあったような人工知能型のコンピューターは、人間の脳と同じような比較的コンパクトな装置で周囲の状況や人間の会話を理解して反応していたが、現実の人工知能というのは、googleが検索システムのために持っているような、ネットワーク上に分布したストレージやプロセッサの集合体として、すでに実現可能な規模にまで成長しているのではないかという気がした。つまり、ハードウェア的には人間の言語を理解するような人工知能を実装可能なものがすでに存在していて、足りないのはそこに載せるソフトウェアだけなのではないかという気がしている。

「宇宙創成はじめの3分間」を読んでいたら、たった1章で終わってしまったビッグバン仮説による宇宙創成期の記述に続いて、なぜその時期に物理学による宇宙論が急速に発展したのかについて、ワインバーグ氏が意見を述べている章が続いていた。初期宇宙のモデルの妥当性の一部を証明する宇宙背景輻射が観測されたのが直接の理由ではあるけれども、ビッグバン理論というのはガモフによって以前から述べられていたし、マイクロ波領域の観測技術も以前から存在していた。そしてあとから考えればビッグバンモデルの証拠になるような観測は、近赤外域の天文観測からも実は得られていたという。足りなかったのは、そういう観測実験によって大胆な理論を実証可能だということが、研究者一般に知られていなかったか、あるいは知っていても信じられていなかったからだろうという考察だった。

現在も、局所的なシステムで従来的な認知や判断の研究をする人工知能学者と、分散的なシステムで実用的な検索システムを開発するgoogleを組み合わせようという発想があまり活発であるように見えないのは、過去に何度も失敗してきた人工知能実現の試みが現存する技術で飛躍的に進歩するという可能性が、多くの研究者や技術者に信じられていないからなのではないかという気がする。

知能とは何か。定義の仕方はいろいろあるとは思うけれども、非常にざっくりとした定義をすると、自分の置かれた環境について認知し、知識ベースも利用して判断を行い、判断に基づいて行動を支持することという一連の動作を指すと言える。知能のレベルも神経系の規模に応じていろいろあるけれども人間の場合を考えると、脳幹までの原始的な部分で解決可能な反射があり、それよりもっと目的を持った動作を迅速に実現する小脳の運動回路がある。そして、大脳辺縁系の感情的な反応と、それらを統合して論理的な思考をする大脳新皮質の反応がある。この中で、特に人工知能として実現したいのは、論理的思考と、ある程度の感情的な反応だろう。反射や運動などは、ロボット制御などで別に研究されているが、ここでは考えないことにする。

感情の作用も脇へ寄せて論理的思考の仕組みだけを考えると、大脳新皮質の「形態的特徴のない」連想記憶装置としての特性が重要になっている。大脳辺縁系以下の神経組織は、部位ごとの機能や入出力器官との位置関係などによって、それぞれに特徴的な形状をしている。これに対して、大脳新皮質の、大脳の表面にシワを作って覆いかぶさっている部分というのは、場所によって機能はそれなりに分かれているけれども、見た目にはほぼ同じような組織が均一に並んでいて、その内側に向かって相互接続用の配線(軸索)が束になって走っている。

大脳辺縁系以下の神経組織が上げてきた電気信号を受けて、その電気刺激のパターンに対応した、大脳新皮質の活動パターンが生じる。そのパターンは時々刻々と変化する入力と、やはり別の刺激によって変化する周囲の大脳新皮質の活動パターンの影響を受けて、別のパターンへと移り変わる。そうした変化の中で、ある程度の時間にわたって安定的に存在するようなパターンが残る場合がある。これが、脳内に発生する概念の正体で、この概念に対応する外部の図形や信号などが記号ということになる。記号を連続に組み合わせたものの一種が言語になる。

大脳新皮質に生じた安定パターンは、別の部位に複数の安定パターンを呼び出す。こうして呼び出されたパターン同士が互いに互いを呼び出すような組み合わせになっていると、パターンは安定してより長時間存在し続けるようになる。逆に複数パターンによって安定化されないような連想パターンは、雑多な信号によって短時間のうちに消滅する。こうしていくつかのパターンが存在しているところに、外部から新しい刺激による神経信号が入力されると、入力信号と既存のパターンの両方から刺激を受けて連想されるパターンが呼び出される。

脳内ではこのようなプロセスが起こっているが、脳は現在の外部刺激による入力だけでなく、比較的最近の外部刺激による入力の影響を内部的に保持していて、その両者を組み合わせて新しいパターンを作る。その一部が運動期間とつながっていて、それが人間という知能システムの出力となる。人間には視覚や聴覚、触覚などの感覚があるが、それぞれが大脳新皮質の別々の部位に最初に到達し、次に外部入力に直結していない部分にパターンを連想することで統合を実現しており、またその部分が直近の入力の影響を保持していることで、状況のコンテキストを内部表現することができる。長期的な記憶は、あるパターンがどのパターンを呼び出すかという部分にプログラムされるので、また別の機構となる。

大脳では近傍にある複数の神経細胞が活動電位を発する(発火する)頻度のパターンで情報を表現しているが、googleのシステムのようにネットワーク上にあるサーバー群では、パケットで交換される電気信号や光信号のビットパターンとして表現される。神経細胞が生体電気信号をやり取りしている方法とクラウドシステムがビット情報をやり取りしている方法は異なるが、ネットワークの階層モデルに似た考えで言えば、物理層やデータリンク層が異なるだけで、適切な階層インターフェイスを用いれば、大脳とクラウドで互換性のある上位層を実装することは不可能ではない。

したがって、生体と電気システムはそれぞれの特性に合った下位層を利用すればよく、神経電位のレベルでシミュレートしなくとも知能のシミュレートは可能だろう。人間の脳で神経細胞が利用している電気信号の伝達速度は、軸索を使った比較的長距離の結合で毎秒数十センチだが、電気系あるいは光学系での通信速度は、秒速30万キロの光速度に近い水準になる。中継器による遅延の影響はあるが、単純に信号伝達速度だけで考えれば、電気系の知能システムは生体知能システムに比べて1億倍くらいの空間的サイズでも、時間的に同程度の遅延で結ぶことが可能ということになる。

人間の脳は立体的に折りたたまれているが、表面積を計ると2000平方センチになるという。これと等価な電気系システムの面積はおよそ2000万平方キロとなり、だいたいヨーロッパや北米の面積と同程度ということになる。大脳には下位の神経組織があるし、クラウドシステムにはサーバー1台ごとに高性能の記憶装置や演算装置があるから単純な比較はできないが、ノード間接続の遅延時間だけで言えば、人間の大脳と地球上のコンピュータネットワークというのは似たようなスケールオーダーにあると言える。googleが抱えている全情報量を考えれば、すでに人工知能を実現する物理的条件は揃っていると言える。

ではどのような上位層を載せれば良いかという話になるが、まず連想記憶の系はgoogleの検索システムのようなもので十分だろう。十分多量の情報の中から、十分短い時間で、重み付けされた複数の情報を、文字入力から連想することができている。問題は、大脳皮質で発生した活動パターンが周囲の神経組織に別の活動パターンを呼び起こすような、再帰的な連想ができるようなデータ形式に、googleの検索結果がなっていないというところにある。

通常の、文字列からウェブページを検索する部分については、呼び出したページに関連付けられている文字列への逆リンクテーブルのようなものを用意するだけで、再帰的な連想ができるようになるだろう。画像や動画でも同じように、関連付けられている文字列や、他の画像や動画の共有数などで再連想が可能かもしれないが、より知能的にするためには、画像を図形的に読み取って、人物や情景を認知するようなシステムが必要になるかもしれないし、動画であれば時系列的なシーン認識などの技術も必要なってくるだろう。この部分には古典的な認知工学の技術が使えるだろう。

このようにして、ある端末から入力される文字列や画像や動画を認識し、そしてそれを時系列的に受け入れることで、過去の入力による連想も含めた複数の情報をバックエンドに想起し、そこから連想される出力でリアルタイムに文章や映像や音声を合成すれば、かなり複雑な人工知能が実現可能になるだろう。現在のgoogleが持っているシステムを直接流用するならば、中間パターンとして文字列も使えるだろうし、あるいは直接的意味を持たないビットパターンを交換するようになるかもしれない。

おそらく個別技術としては既に出揃っていて、あとはそれらを統合する研究にどれだけの研究者が関心を向けるかというところだけが残っている段階にあるような気がしてならない。宇宙背景輻射の観測前夜と同じ状況に、今の人工知能研究は位置しているのだと、直感的に思う。

残りは偶然が支配する領域でもあるので、googleの検索システムがチューリングテストを通過するようになるまで、いったいあと何年かかるかというところはわからない。しかし、私たちは思いのほか未来的な技術を手にして遊んでいるのではないか、ということを思った。
[PR]
by antonin | 2011-06-04 17:41 | Trackback | Comments(0)
トラックバックURL : http://antonin.exblog.jp/tb/15690538
トラックバックする(会員専用) [ヘルプ]
※このブログはトラックバック承認制を適用しています。 ブログの持ち主が承認するまでトラックバックは表示されません。
<< 陰謀論再び 近況など >>


フォロー中のブログ
外部リンク
外部リンク
ライフログ
ブログパーツ
Notesを使いこなす
ブログジャンル