ソフトバンク、感情認識ロボット 「Pepper(ペッパー)」 来年2月発売。価格は19万8000円。「人々の喜びを大きく、悲しみを少なくしたい」孫さんの夢が現実へ
人々の期待が膨らみ続けてきた人型ロボット。みんなの夢を一人の男が現実のものへと押し上げた。ソフトバンクの社長、孫正義社長です。
昨日、孫さんがTwitterで
皆さんに我々の新しい技術への取組みをご紹介できるまで、あと1時間弱。ワクワクします。インターネットでの生中継します。
6/5 13時〜 http://t.co/P3Ys1f4C7R
— 孫正義 (@masason) 2014, 6月 5
と、ツイートをしており、この時間帯はみんな仕事の手を止めて生中継を見届けたんじゃないでしょうか。
〜〜〜〜〜〜〜〜〜〜
ざわめきたった会場にアナウンス「開始の時間となりましたが、ただいま最終準備中」と流れた。前日に孫さんが「明日、我々の新技術への取り組みを発表します。私は、25年間この日が来ることを夢見て来ました。」とツイートしていたからなのか、場内は妙に静かな雰囲気になった。
会場は暗転して、いよいよ登場するシーンで幻想的なバックミュージックが会場を包みながら、ロボットが登場し、孫さんも登場しました。
神妙な顔つきの孫社長「ロボットな行為というと、ハートがかけていると言われる。そこに心がない、感情がないと言われるからです。ロボット市場ではじめて、我々がロボットに感情を与え、心を与えることに挑戦します」。
Pepper(ペッパー)と孫社長がコミュニケーションを取るプレゼンテーションも見られ、実際まだまだスゴいロボットではありませんが、暖かみのあるロボットを作りたいという気持ちが伝わってきました。
Pepperいわく「プレッシャーに弱い」そうです。
孫さんのプレゼンテーション(引用)
Pepperは音の方向を認識。会場全体の関係者が寸劇。みんながPepperと呼びかけます。距離センサー(赤外線)も搭載。Pepperと孫社長の距離は1mと少し。
ALDEBARANのCEOとのフォトセッション後、孫社長1人になってプレゼンテーション。
「1949年に何が起きたか、それはノイマン型コンピューターの登場です。このコンピューターは人間の左脳、計算や記憶など、人間がロジカルにものを考えて整理して伝えることにやくだってきました。それから65年がたちました。今日この日が、コンピューターがあの日から変わったと言われる歴史的な日になります。
コンピューターはいずれ、人間の右脳、感情や創造性にも役に立つと、私は思っていました。これは今までのコンピューターの役割とは全く真反対のものです。Pepperはその第1歩。感情を理解して自ら動くロボットです」
感情エンジンは「ありがとう」という人間の喜びを学習してクラウドAIで、学習をたくわえていきます。家庭の中でとじたプライベートAIと、集合知を共有するクラウドAIを搭載。孫社長「空気を読んで人を笑顔にする」とコメント。
2015年2月、19万8000円で一般販売。明日からソフトバンクショップで披露。駆動時間は12時間。9月にも開発者向けにSDKを提供します。
開発したALDEBARAN社のブルーノ・メゾニエCEO登場。ソフトバンクグループの企業です。
「今日、みなさんには未来の姿を見せられたと思う。ソフトバンクと協力して新しいカテゴリを築きました。Pepperは今日から新しい未来を切り拓きます。これは長年の目標でした。孫社長は私たちと同じビジョンを持っていました。
感情を持つロボットの最高なものがPepper、究極のインターフェイスで見た目もかわいい。最適なやり方で人とコミュニケーションします。音声や身振りで感情を表現します。感情認識エンジンを独自のアルゴリズムで開発し、相手の表情や声の調子で感情を読み取り、適切な方法で反応を返します。たんなる音声ではなく、最適なジェスチャーをともないます。Pepperはとてもかわいくて、とても誠実なロボットなんです。
個人情報はきちんと保護します。そして進化しつづけます。テクノロジーの修正ではなく、人工的な生き物というか、どんどん進化していきます。それはアプリケーションをダウンロードして進化させていきます。開発者はグラフィックデザイナーなどに仲間になって欲しいと思います。秋葉原と表参道に今夏、アトリエをオープンします。開発者会議も開催予定です。
Pepperのようなロボットは私たちの生活にあらたな側面を与えるようになります。ネットやPCが私たちに進化をおよぼしたようにです。携帯がどんどん進化していったようにです。Pepperはまだ、映画のロボットようには動きません。ただここから始まるのです」
ここでFOXCONNのテリー会長が登場。孫社長はiPhoneを製造している会社として紹介、Pepperの製造はFOXCONNが担当します。「感情がなければロボットはロボットのままで、Pepperはそうではない」。
孫社長のコメント「Pepperは今までのロボットとは、ひと味違うのが分かっていただいたと思う。人の感情を理解するというところに重要な意味をおいている。日本語では4500ほど感情を表す言葉ある。それを全部理解しているわけではないが、かなりいろいろな表情や声のトーンを理解する。一番難しい感情が愛、それにどれほど近づけるのか。少なくとも、喜んでくれている、つまらなそうにしているというのはかなりできる。最終的には人の愛を理解できるようにしていきたい。そして人々を幸せにするのが願いです。
これまでの機械は人が命令して操作するもの。今回の挑戦は人が操作するのではく、自らが意志をもって家族を楽しませるもの。自ら学習しながら進化していく。人間にとって究極の行動は愛をみたしたいということ。たとえば、災害現場に自らの意志で向かって救助する。いずれは人間の力のおよばないような自然災害やウイルスに対応していくことができるようになるかもしれません。我々は人々の笑顔をみたしたい。地球の裏側にいるような名も無いどろんこにまみれた女の子の笑顔を我々は見たい。科学技術は金儲けのためにやるのではなく、人に優しい理念のあるもの。先の長い挑戦だと思う」
出典:速報:ソフトバンク、感情認識ロボット Pepper 来年2月発売。価格は19万8000円 - Engadget Japanese
Pepper(ペッパー)のスペック
◆スペック
サイズ(高さ×奥行×幅):1210mm×425mm×485mm
重量:28kg
バッテリー:リチウムイオンバッテリー
容量:30.0Ah/795Wh
稼働時間:約12時間以上(ショップでの利用を想定した場合)
・センサー類
頭部:マイク×4、RGBカメラ×2、3Dセンサー×1、タッチセンサー×3
胸部:ジャイロセンサー×1
手部:タッチセンサー×2
脚部:ソナーセンサー×2、レーザーセンサー×6、バンパーセンサー×3、ジャイロセンサー×1
・可動部
自由度 頭:2、肩:2×2(L/R)、肘:2×2(L/R)、手首:1×2(L/R)、手:1×2(L/R)、腰:2、膝:1、ホイール:3
モーター:20個
ディスプレイ:10.1インチタッチディスプレイ
プラットフォーム:NAOqi OS
・通信方式
Wi-Fi:IEEE 802.11 a/b/g/n(2.4GHz/5GHz)
イーサネットポート×1(10/100/1000 base T)
・移動速度:最大3km/h
・移動可能段差:最大1.5cm
Pepper(ペッパー)登場
特集 | ロボット |
特集 | ロボット |
質疑応答に答える孫さん
Q:今回のロボット、人型にこだわった理由とはどういったもの?
孫:やはり感情移入するという意味で、他の形より人間の形の方が家族の一員として感情移入しやすいんではないかということです。
Q:人っぽさが海外の同様のロボットに比べてアドバンテージになるということですか?
孫:はい、それもあります。
Q:具体的にはどのようなアドバンテージ?
孫:日本には「鉄腕アトム」があったので、世界の中でもロボットに対する親近感や夢を抱いている人が多いと思います。人の形をしたロボットが多くの人の心をときめかせるし、日本だからこそアニメの世界でなじみがある。そういう夢を描いているエンジニアも多いし、待ち望んでいる人も多いのではないかということです。
Q:ロボットの身長や体重、タイヤがついてるとか、細かいロボットの仕様を伺いたいというのが1つ。もう1つ、みなさん伺いたいことだと思いますが、アメリカのT-mobileの買収に合意したという話がありますが、話せる範囲でお答えいただきたい。
孫:身長は120cmぐらいだったかと思いますが、体重その他、詳細は追って。T-mobileについては、その発表会ではないのでコメントを差し控えさせていただきます。
Q:3点質問です。日本の家には段差があると思うが、そちらはどうお考えですか。また、クラウドが落ちたときにはどうなるのでしょうか。胸のタブレットは外せるのでしょうか。
孫:12時間以上の連続動作を目標に作ったので二足歩行はしていませんが、技術的には我々のグループとして長くもつようになってきています。バッテリーが5時間、10時間と保つようになれば二足歩行もありえますが、お店で立ちっぱなしでも大丈夫なように、また家庭でしょっちゅう電池切れしていては白けてしまうので、まずは連続稼働時間を長くできるようにということです。クラウドについては複数のデータセンターでやりますし、電源も落ちないようにします。インターネットサービスを毎日提供している立場から、クラウドのサーバーは落ちないようにと考えています。タブレットは差替できるようになっています。
Q:今日のデモではPepperくんが滑らかに応答していたがこれは事前にプログラミングしたものなのか、それともすべて自律なのか。プログラミングであれば、どこまでがプログラミングされたものなのでしょうか。19万8000円という価格設定ですが、利益はありますか?ビジネスとして、どれぐらいの利益規模を考えていますか?
孫:滑らかな会話ができるようにというのは、アプリケーションをシーンに合わせて用意していて、デモの多くの部分はアプリケーションに基づいたもの。ただ、会話で何を喋っているのかは認識していて、ロボットオーディションのコーナーのように、怒っているのか悲しんでいるのかという感情を読み取っています。これは感情認識エンジンが稼働し始めているということです。明日から銀座と表参道の店舗に出ることになっていて、30分に1回、アプリケーションとして予めジョークをいったりダンスしたりのショーをできるようにしています。その合間合間にはフリートークの時間があり、人工知能でお客さんとの対話をします。フリートークだと事前にシナリオがあるわけではないので、様々にお客さんとのトークを楽しみます。その中では会話がかみ合ったり、なかなか成立しなかったりすると思いますが、クラウドで毎日進化します。来年2月の発売までに、最初は2店舗、最終的には数百店舗でできるだけ多くのお客さんとふれあい、会話をする中で学習し、進化していきます。
利益は出ません、それ以上にコストはかかっているが「低い値段で高い志」、利益を度外視してでも、1人でも多くの人が、PCと同じぐらいの値段で買えるということに力点を置きました。子犬を飼うのでも20万円前後しますから、それと変わりません。保守管理が別途ありますが、ペットでいえばペットフードをあげたりお医者さんに連れていくのと同じような部分です。保守費用は別途ありますが、本体価格はあくまでも19万8000円。量産するようになればそれなりのビジネスとして成り立ちます。Foxconnを製造パートナーとして選んだのは、それが大きな理由です。どのくらいの事業規模かは、まだ今日発表したばかりなので、これから詰めていくということになります。
Q:利益は保守やソフトウェアやアプリから?
孫:そちらはそちらでコストがかかりますので、あくまで量産、何万台、何十万台、何百万台になっていけば、いずれはコストダウンでビジネスが成り立つようになるだろうと、そういう意味です。
Q:クラウドサービスで料金を取るのか、利益を考えているのか。また、アルデバランの従来ロボットとの違い。見た目やサイズはわかるが、その他の点はありますか?
孫:あまり目先の利益は出なくてもいいと、ゆたっとした構えでいます。量産効果が出てくれば赤字にならない程度にはなるだろうと。大きく稼ぐというよりは、アプリのプラットフォームとして作るので、いろんなコンテンツやアプリが出てきて稼げるようになるのではないかと。アルデバランの従来のNAOとの違いについては、ブルーノさん。
ブルーノ:一番の違いは見た目もサイズもですね。機能については、ソフトウェアは同じですから、今すぐではないが、NAOと持っている機能と同じものを装備することができます。人との対話や感情認識の部分も互換性があります。コミュニティを作っていて、その中でアプリが作られれば、ロボットが人のために何かできるようになります。そうしたロボットが増えていけば、より多くの人に貢献できるようになります。なぜ人型なのかという質問がありましたが、とにかく、人々との対話をできるだけ効果的に行うためには人型なのです。ポジティブな感情を持ってもらうためです。動物にも愛情を抱くことはありますが、人型の方がより育めるからです。
孫:25年前からなんとかロボットに心を持たせたいという思いがあり、それが今回、COCORO SBというクラウドサービスを提供することで新たな進化が生まれ、共同でやることによって進化が加速するのではないかと。
Q:クラウドは月額制ですか?
孫:それはある程度かかりますが、どれくらいにするのか、そういうサービスにするかは開始の2月までに詰めていきたい。
Q:NAOとの互換性は、NAO向けが使えて、逆もいけるということですか?
ブルーノ:その通りです。もちろん形は違いますが、基本アプリは同じで、双方互換性があります。今すぐにPepperに導入できるわけではありませんが、調整すれば使えます。
Q:「25年間夢見ていた」とツイートしていましたが、25年前に夢を見たきっかけは?
孫:潜在的な意識は、子どものころに見た鉄腕アトムです。アトムが空を飛び、100万馬力で悪者をやっつけるのに胸を躍らせ、学校から急いで帰ってきてアニメを見ていたのを覚えています。ただ、アトムは涙を流せない。心がないからわからない。痛いとか悲しいとか嬉しいとかがわからない、という話があったと思います。それってかわいそうだなと、子どもなりに思い、いつか大人になったとき、ロボットがそういうことを理解できればいいなと思いました。ソフトバンクを創業してコンピュータに触れるようになって、CPUの能力もメモリ容量も通信機能も進化していく中で25年ぐらい前に、PCのはるか先、一番難しいことである“感情”にも挑戦したいと。
僕なりの理論では、人々の感情を数値化することは可能なはずだ、とその時に思ったんです。人間が理解できるということは、コンピュータにも理解できる。そうなるはず。ロジックを考え始めて、チップや通信、クラウドなど要素技術が出てきて、とうとうロジックと技術が揃って実現できるときが来た。ブルーノとの出会いで、体もロボットとして用意できる。今こそ挑戦するときだと思いました。
Q:Pepperという名前の由来、込めた思いは?
孫:いろんな名前を議論して何百も候補を出しました。コードネームは「太郎」で、ちっちゃな男の子を育てるように、心を込めて作った。でも、世界に提供したいということで、日本的な名前よりは世界中の人々が覚えやすくてでもちょっと変わっていて、ということで絞り込みましあt。
Q:Pepperはソフトバンクショップなのかオンラインなのか、どこで販売していくのですか。また、赤字からスタートするということだが、ロボット事業をどういう方向へやっていきたいのか。通信やスマホ事業との関連性も含めて教えて下さい。
孫:ソフトバンクショップは全国に数千あって、どこででも買えます。ショップの大半には毎日ある状態になる予定で、順次、店舗数は拡大します。ネットカンパニーですから、ネットでも注文できます。まずは日本からスタートして、ある程度こなれたら世界展開もやっていきたい。最後まで赤字で行こうと考えているわけではなく、今は台数が少ないので製造コストより売値が安くなるが、事業として成り立つようにと考えています。ソフトやアプリ、コンテンツ、色んな形で利益も出るようにしていきたい。通信はWi-Fiを通じていろんなクラウドとのリアルタイムのやりとりが行われますが、Wi-Fiだと家の片隅で信号が弱かったりするので、ソフトバンクの得意とするLTE通信チップも近いうちに載せていきたい。
Q:Googleがロボットベンチャーを買収して商用化を狙う中で、市場が立ち上がる前に先んじて事業を開始したタイミングについて。Foxconnとの連携の意義について、よりハード展開を加速される考えがあるのでしょうか。
孫:Googleの狙いは我々とちょっと違うのではないか。彼らはより産業用の、生産性のあるものを求めていて、コストももっと高いモノだと思います。我々は生産性というよりは家庭の中やお店で人々を楽しませたい。というところに力点を置いています。だからこそ感情認識エンジンを積み込んでいます。ソフトバンクはグループ会社でもゲームとかやってるように、エンタメにも力を入れているので、そういう観点からは違いがあると思います。感情認識および自立的感情を持つことについては、特許を100件以上出願済みです。単によその会社のロボットを見よう見まねで後追いでやったのではなく、独自の特許をたくさん出願しているという立場にあります。
Foxconnについては、周辺機器やアクセサリではすでに取引があり、Yahoo!BBのモデムもFoxconnで作っていて、長いパートナーシップがあります。今回、本格的なロボットへの参入で、Fxconn以外に考えられないということで製造パートナーになっていただきました。PCやスマホなどを自分で作りたいということではありません。
Q:海外展開と、クラウドによる集合知で成長が加速するというお話ですが、海外のユーザーの利用の仕方も反映されるのでしょうか、それとも各国で分かれているのでしょうか。また、開発者向けのSDKではどういったことができるのでしょうか。
孫:海外展開は順次。それぞれの国で習慣が違うので、その国に力点の置かれたものは国に当てはまるようにするが、笑顔は何人でも笑顔だと思うし、悲しんでいるトーンは何語でも同じトーンだと思う。言葉の内容より声のトーンや表情がより感情に近いというのが我々の研究結果で分かっているので、直感的な感情は国をまたいでいけるのではないかと思います。集合知とローカル、家庭のローカルと国のローカルと、それぞれを含めて集合知を合わせていきます。
Q:SDKですが、NAOqiという専用のOSがあり、すべての感情認識機能に埋め込まれています。開発者会議を9月に行うことになっているので、どのようなことができるか、何の可能性があるのかを説明します。また、アトリエを開設するので、来てくれれば何ができるか、どんなツールが利用可能かも知ってもらえます。
孫:人の心を和ませたい、寄り添いたい、その思いが融合して、こうして人類初の感情を持つロボットができたと思っています。多くの部分はアプリで作られていて、その中での会話、言葉という限られた中での認識です。これは小さな一歩ですが、人工知能はクラウドになるので、シナリオによらないフリートーク部分も、銀座や表参道のショップでぜひ試して下さい。100%の会話のやりとりはできないが、会話として7割~8割は成立します。そこに感情認識というものが芽生え始めています。1歳2歳の子どもは「愛」といわれてもわからないけれど、嬉しいとか悲しいとか、嫌がるという認識はできます。我々の感情認識でいえば、最低、そのレベルに行きつつあります。完全認識はアプリの中で稼働させる形ですが、将来はフリートークでも感情認識ができるようになります。認識できるということは自我を持っているということ。幸せな感覚で育まれたPepperはより幸せに、寂しがらせるような家族で育ったPepperは寂しがり屋のPepperになるということです。