2010年3月25日木曜日

HARKをテキサイロボットに搭載



米国西海岸時間: March 25, 2010

人々が顔を合わせて話をするとき、カクテルパーティ効果を経験することがあります。カクテルパーティ効果とは、たとえ人がいっぱいで騒がしい部屋でも、私たちは両耳の聴覚を使ってある一人の話に集中し聞き取ることができるというものです。残念ながら現在のテレプレゼンス技術ではこの重要な能力を使うことができません。しかしありがたいことに、離れた場所にいる人々を効果的に橋渡しするための新しいツールをもたらしてくれている研究者達がすでにいたのです。

京都大学の奥乃博教授、高橋徹特任助教、ホンダ・リサーチ・インスティチュート・ジャパン(HRI-JP)シニア・リサーチャーの中臺一博さん、京都大学と東京工業大学の大学院生4人のみなさんがウィローガレージに1週間滞在し、テレプレゼンスロボットのテキサイにHARKを搭載しました。HARKとは、HRI-JPと京都大学が共同で研究開発しているロボット聴覚システム(Honda Research Institute-Japan Audition for Robots with Kyoto University)のことです。このロボット聴覚システムは、音源定位、音源分離、音声認識特徴量抽出、音声認識機能を備えています。

HARKシステムはROSとテキサイにうまく移植されました。テキサイは8つのマイクを装着した緑色のサラダボールをヘルメットのように頭にかぶせてもらい、ROS用のharkパッケージも用意されました。そして、HARKチームはテレプレゼンス技術の可能性を示す3つのデモをやり遂げました。

最初のデモでは、別のテキサイを介して参加した1人を含む4人がお互いに話し合っている間、HARKシステムを搭載したテキサイがそれぞれの声を分離しています。2つめのデモでは、音源の定位が行われ、音の方向とパワーをレーダーチャートに表示できることがわかります。最後のデモでは、これら2つのデモを1つにしたリモートユーザーのための強力な新しいインターフェースが紹介されています。それはテキサイのリモートユーザーが様々な音や声が聞こえてくる場所をまず特定して、その中からどの音に集中するかを選択できるというものです。そしてHARKシステムはリモートユーザーが望む音を周囲の雑音や余分な声などを除いた状態にして届けます。たとえ人で混み合った場所でも一対一の話ができるのです。

HARKはHRI-JPと京都大学との密接な連携による共同研究、そして奥乃教授のロボット(コンピューター)の聴覚を使って聴覚に障がいがある人を助けたいという情熱によって誕生したものです。HARKはオープンソースで提供されていて、研究目的には無料、商用目的にはライセンス供与も可能です。

0 件のコメント:

コメントを投稿