研究室の主である森島繁生教授にお会いするために指定された部屋に向かったところ、最初に出会ったのは森島教授ではなく、学生さんたちだった。夕方遅かったにもかかわらず多くの学生さんたちが、それぞれの席で熱心にパソコンの画面と(おそらくは自分の研究対象と)向き合っていた。

 本来の教授室は隣りにある。しかし、そっちのドアは締め切られており、学生室を通ってからでないと教授室に行けないようにしてあった。だから、最初に学生さんに会うのは正しいルートで、その後、ぼくはすんなり森島教授の部屋に迎え入れられた。

早稲田大学先進理工学部応用物理学科の森島繁生教授。
[画像をタップでギャラリー表示]

 大きなモニタの前にあるミーティング用の大テーブルで相対し、森島教授はまずはこんなふうに説き起こした。

「顔の研究というのは、もう僕は30年くらいやってますけど、通信から始まっているんです。顔って、情報伝達の手段として、端的に感情を伝える手段だったり、意図を伝える手段だったり、表現として非常になじみが深いものですよね。だから、ただ音声だけで話すのでなくて、話している相手の顔が見えるようにしたいという研究でした」

 これは今聞くと、何を言っているんだろうという話だが(スカイプなりほかのアプリなりで、簡単に実現できている)、30年前はまったく環境が違った。

 1980年代のおしまいの頃である。

[画像をタップでギャラリー表示]

 電話の回線は基本的にはアナログで、光ファイバーが個人宅にくることなどありえなかった。かろうじてISDNというデジタル通信サービスが登場していたはずだが、普及しているとは言い難く、「インターネット」という言葉を知る人も日本ではほとんどいなかった。そんな時代に、電話回線で「顔を送ろう」というのである。

「狭帯域なので普通に送ってしまうとコマ落ちしてカクカクして使えたものじゃないんです。それをいろいろ工夫していたわけですが、結局は送れなくて、そこで発想を転換して受信側と送信側にCGモデルというか、アバターを置いておいて、しゃべった言葉を代弁してくれるようにすれば、全部の画像を忠実に送らなくてもコミュニケーションは成り立つんじゃないかと考えました」

 つまり、音声はそのまま送るにしても、画像については、話している人がどんな感情状態にあるのか、あるいは何をしゃべっているのかといったシンボリックな情報だけ送ってやると、受信側に置いてあるCGの本人そっくりな人物モデルが、なりかわってしゃべりかけてくれるというようなしくみだ。

「当時、これは知的通信と呼ばれて、ちょっとしたブームになりました。それまでの通信の概念は、信号を統計的な性質に基づいて符号化するというものでしたが、知的通信では、伝送される信号が持っている情報の意味内容に立ち入って伝送方式を切り替えるわけです。そのために、知識処理や人工知能技術も必要でしたし、CGについていえば、この時に本人のモデルを合成するためにやっていた研究が後に顔のCG的な研究につながっていきました。あるいは送信部分を深めていく中で、顔の認証的な研究にもつながっていったんです。でも、最初のとっかかりは、やっぱり通信だったんですよ」

この連載の次の
記事を見る