人気ブログランキング | 話題のタグを見る

情報産業に足りないのは「身体の知覚」か 人間ってナンだ?超AI入門シーズン2 第一回「会話する」



2018年11月中国のAIアナウンサーが流暢にニュースを読み上げ驚かせた。AIは誰の声でもつくれる。早口言葉だって得意。

「AI研究でこれから進歩すべきは本当の意味で言語を理解する能力です。コンピューターが私たちと交流するようになれば言葉の本当の意味をより深く理解できるようになるのです」

言葉を使うとは。言葉の意味を理解するとは。会話することの本質ってなんだ?その謎に迫る技術こそディープラーニング。

坪井一菜(女子高生AIりんな開発者)。今のりんなは電話のように声で会話できる。まだ素っ頓狂だけれども女子高生っぽい言葉で友達のような感覚を表現。ユーザーは740万人を超える。

雑談で人を知れる。人間は会話の時少しの飛躍を楽しんでいる?

今のりんなの会話は第三世代の共感モデル。相手がこの話題を続けたいか他の話題に行きたいのか推測する。ストーリーを決めて返答するのではなくその場で返答を考えての返事をつくっている。

自然な会話を続けるための対応:相手に新しい話題を切り出す, 質問する, 相手の発言を肯定, 聞き手に回る, あいさつを返す 等

りんなもシークエンストゥシークエンスという大量の会話データから「相手の意図を判断するAI」と「返答を生成するAI」の二つで自然な会話をプログラムしている。

AIはどのように会話している?
相手の話がポジティヴかネガティヴかは品詞ごとに分解し解析するのに加え、RNN(リカレントニューラルネットワーク)を駆使しどんな端午の組み合わせがどんな順序で並んでいるのか文章全体の文脈からニュアンスを解析。

Seq2Seq(シークエンストゥシークエンス)は、人が相手の言ったことを全部聞かないと答えられないように、エンドオブセンテンス(EOS、文の終わり)が入って初めて出力すること。つまり相手の言った情報がすべてたまる技術。文章という意味のまとまりをはっきりと認識する。単語から文章、さらにはさらに長文までためることが出来る様になればさらに向上していく未来がある。

世界的なAI研究者、フェイスブック人工知能研究所所長ヤン・ルカンさんはこうした会話する技術が言語の翻訳でも役立つという。

「RNNはまた異なったものでとても頻繁に文などの一連のデータ(の処理)に使われます。例えば英語から日本語にある文を翻訳したい場合一単語ずつ読み取り意味表現を組み立てます。これは簡単に言えば長い数字のリストです。この長い数字のリストから日本語を正しい順番で出力するため別のニューラルネットワークに入力されます。つまりリカレント(=再帰する)ネットワークです。基本的に文の長さによりネットワークの大きさも変わるのが特徴です。」

RNN、そしてSeq2Seqという技術の発達。それによりAIは相手の話を文章で受け止められる段階まで来た。

金田隆志(音声合成開発者)

感情表現、語尾を上げたり下げたりの表現力をディープラーニングで人間に近く学習し表現。AIも人の声を学習し感情に訴えることができる。でも本当に言葉に感情を込めるなら言葉の意味を知らねばならない。会話するAI、最大の課題。

意味を理解するとはどういうことか。文字が入ってきたとき文字を出すので会話が成立するようにみえるが本当に成立しているか。

ジョン・サールの「中国語の部屋」:ある作業員の仕事は外から入ってくる文字列をマニュアルに沿って変換して送り返すこと。例えば感情的な言葉には感情的な言葉を返す。こうすると何も言葉の意味を理解していなくてもやりとりが成立する、つまり意味が分かっているとみなされてしまう。

ノーム・チョムスキーが考案した文「Colorless green idea sleeps furiously(色のない緑のアイディアが激しく眠る)」は意味が分からないが文法的には成立してしまっている。意味は分からないのは矛盾しているから?なぜこういうナンセンスな文が存在し得るのか?

松尾先生によると多くの学者が言うことを総合すると、人間は言葉を使うこと以外は大体サルと同じ。サルやイヌはどういうことをやっているかというと「環境を知覚し運動する」こと。その上に言葉のレイヤーがあり、「環境→知覚→運動」は「言葉」と2階建て構造で連動している。「言語レイヤー」から「具体的な体験」をイメージするのが意味理解ということ。AIは言葉を聞いて具体的な体験を想像出来たら意味を理解したと言える。

「ほっそりしててもぽっちゃりしてても猫は猫」と言い切れるのが人間の凄いところ。

言語学者フェルディナン・ド・ソシュールは人間はネコという言葉(シニフィアン:言葉・意味するもの)とシニフィエ(概念・意味されるもの)を結び付けて理解しているが、AIはネコという概念を思い描くことができないとされていた。概念をもたないAIは少しでも違う見た目のネコを猫だとは思えない。ところが…

ヤン・ルカン「ディープラーニングがここ数年で大きな進歩をもたらしました。AIに自動的に学習させ概念と概念の関連を見出せるようになりました。AIに世界を観察させたくさんの概念を身につけさせることも期待できます。概念の集合は私たちが「常識」と呼ぶものになりのです。世界についての十分な概念が集まればAIにも「常識」が芽生えてくるはずです。」

AIは言葉と概念を結び付けて会話できるようになるのだろうか?

米国・ワシントン州レドモンド、マイクロソフトリサーチ。世界中からトップクラスの人工知能研究者が集まっている。ここで意味理解につながるある研究が行われている。

人工知能研究者ペンツァ・チャン氏とチウユアン・ファン氏。
「きょうは私たちがやっているtext-to-image(文章から画像を生成)の研究をお見せします。『ドローイングボット』と一般的に呼ばれているものです。このAIは自然言語で1つの文を入力するとそれに沿った画像を返します。

『この鳥は赤くて白くてとても短いくちばしを持つ』と入力すると画像を出す。例えばこの鳥。この鳥は赤くて白い、くちばしもとても短い。この鳥も凄くリアルに見える。ほかのどの鳥とも違う。」

他の文章を入れても複雑な文章でも画像を生成。

「この画像を見ると与えられた文『黄色い』や『頭が黒い』に対応している。だからここは黄色いし頭が黒くなっていてくちばしも短い。でも鳥はいろいろポーズをとっている。背景も違う。これはAIの力。AIは自然言語の説明にあるちょっとした不確実性を補完できる。そして画像をより詳細なものにできる。

text-to-imageという純粋な自然言語の説明を元に画像を生成する研究はまだ始まったばかりだ。長期的な目標は機械の概念を人間の概念に近づけることだ。機械が人間と同じような理解を持つようにしたい。」

近い将来AIも人間と同じ概念を手に入れる!?

近い将来AIも人間と同じ概念を持ち意味理解できるのか。人工知能研究の第一人者、カナダ・モントリオール大学ヨシュア・ベンジオ教授に伺う。
「脳のニューロン1つ1つにデータ処理能力は無いのです。それがルールに従うように集まってシステムを成します。シグナルを受けシグナルを出す。大量のニューロンが力を合わせると非常に知的な能力を発揮するのです。この仕組みは脳でもコンピューターでも同じことです。」

人間の脳の仕組みも解析すれば物理的な電気信号の連続。学習を適切に繰り返せばいつかAIは人間と同じような知性を持つにいたるのでしょうか?そしてAIが人の話す言葉を本当に理解し会話する日は来るのでしょうか?

ヨシュア「私たちの体や脳は言ってみれば物理法則に従うだけ。ただ非常に複雑なシステムだという科学的な視点をとるならば私たちは本質的に機械なのだとも言えますね。ランダムな『でたらめ』があったり複雑ですが我々は機械なのです。機械としての人間について理解をしっかりと積み重ねていけばその理解を応用して知的な機械を組み立てることもできます。それこそが私たちのデザインした新たな人工知能なのです。

これを受け入れない人もいます。私たち人間は絶対に違う。どんな機械にも再現できない知性を持つと信じる人もいます。なぜなら人間には何か自然を超えた『魂』のようなものがあると。それはしばしば宗教的な信念とも結びついています。しかし科学的な視点から言えば本当にそんなものは無いのです。私たちは単なるシステム、ただし壮大で複雑な機械なのです。

いつの日か知的な機械を作ることが出来る。できない理由はありません。その前に地球を滅亡させなければの話ですが。」

2階建ての2階部分の技術は進展しヒトと同じくらい、人以上になってきている。これからは「1階」と「2階」が連合して動くようになってくる。比較的近い将来にヒトの意味理解を大きく超える技術が出てくるかもしれない。今2階だけなのに人間と同じくらいになっているのはデータの量が多いから。1階とともに行くと人を超える意味処理が可能になる。意味理解が本当にできるのは5年~10年ほどでは。



第一シーズンと重なるところもありましたが、text-to-image技術の話や「2階建て」の話は面白かったです。どうもメディアだけに触れてると「身体性」が失われる気がしたのですが、「言語レイヤー」と「具体的体験」が両輪で知覚に成るという話が腑に落ちました。コンサル等の言葉が上滑りするのは「身体の知覚」が伴わないからかも。「何を話すか」よりも「誰が話すか」が重視されるのも身体性が伴っているかが大切にされているからかも何ても想いました。

囲碁で人知を超えた手が生み出されるように、「1階」も手にしたAIがヒトより上位の知的存在になる、そんな時代の遷り目に我々はいるのかもsりえないと改めて空恐ろしくなった次第でした。

by wavesll | 2019-03-13 20:10 | 小ネタ | Comments(0)
<< 世界構造を理解するための装置 ... 『search』 最新型の2時... >>