スマートスピーカー

スマートスピーカーはWiFiホームネットワークを介してインターネットに接続されており、 音楽のストリーム再生やニュース読み上げを音声で指示することができ、更に、 音声による質問に対しても音声で回答してくれるスマートホームデバイスです。(図1を参照)
また、ネット家電(スマート家電)のコントロールも音声で行う事ができるので、 例えば、『電気をつけて』とか、『テレビをつけて』と言うだけで家電製品をリモート操作することができます。
このようなスマートスピーカーは、音声認識技術とAI(人工知能)技術を利用しているので、 マイクとスピーカーを搭載した音声アシスタントデバイスであるとも言えます。

図1 スマートスピーカーとは

スマートスピーカーとは

このようなスマートスピーカーの代表的な製品としては、
 ・Amazon Echo(アマゾン)
 ・Google Home(グーグル)
 ・HomePod(アップル)
 ・Invoke(マイクロソフト、Harman)
 ・Clova WAVE(ライン LINE)
などがあります。
Amazon Echoが2014年11月に米国で最初に発売されましたが、2016年には数100万台が販売されて大ヒット商品となりました。 それに続いて、2016年に11月にGoogle Homeが発売されました。
これらは当初は英語対応の製品でしたが、ドイツ語やフランス語に対応する製品も発売されるようになりました。

2017年になると、アップルやマイクロソフトもスマートスピーカーの製品化をアナウンスするようになり、 Google Homeは日本語に対応する製品も2017年末に発売されると発表されました。

日本語向けの本格的な製品はLINEが提供する「Clova WAVE」ですが、機能が限定された先行体験版が2017年8月に発売され(価格は10,000円)、 10月5日に正式製品版が発売されました(価格は14,000円)。
その後、日本語対応のGoogle Homeが10月6日に、小型化されたGoogle Home Miniが10月23日に発売され、 日本でもスマートスピーカーが利用できるようになりました。
ソニーは、音にこだわったほか、時刻表示機能も備えたスマートスピーカー「LF-S50G」を2017年12月9日より国内で発売。

このページでは、上述したような各社のスマートスピーカー製品を取り上げて、各製品の特徴や機能を紹介していきます。

<追記>
ここでは、スマートスピーカーの製品化の経緯を紹介するために初期の製品を取り上げています。
最近の製品については別のページで紹介しています。


<製品情報>スマートスピーカーを各社が次々と発売
Googleアシスタントを搭載したスマートスピーカー

  • ソニーは、音にこだわったほか、時刻表示機能も備えたスマートスピーカー「LF-S50G」を12月9日より国内で発売。
  • ソニーは、テレビ向けサウンドバーのフラッグシップモデルとして「HT-ST5000」を11月18日に国内で発売。
  • ソニーが2017年11月に英国、ドイツ、スランスでスマートスピーカー「LF-S50G」を発売。
  • パナソニックがスマートスピーカー「SC-GA10」を発売と発表。
  • スピーカーメーカーのJBLもGoogleアシスタント対応のスマートスピーカーを発売する。

Google Homeは無料の通話機能を追加した製品を米国とカナダで提供開始すると発表。

アマゾンの音声アシスタント「Alexa」を搭載したスマートスピーカー

  • 高音質のスマートスピーカーをONKYOが米国で発売。
  • モバイルバッテリー等のメーカーAnkerがスマートスピーカー「Genie」を北米で発売。
  • レノボもAlexaを搭載したスマートスピーカーを発売。
  • 東芝がAlexaを搭載したスマートスピーカーを北米で発売。

音声アシスタント「Alexa」はいろいろな機器に搭載されて利用されるようになっている。


<関連ページ>
Google HomeとスマートリモコンNature RemoをIFTTTを介して連携。「行ってきます」と言うだけでテレビや照明やエアコンを同時に消せます;
Google Homeでいろいろな家電を同時に音声操作

2017年10月6日に発売された日本語対応のスマートスピーカー「Google Home」の概要や設定方法、使用した結果などについて紹介;
スマートスピーカー「Google Home」の使い方

LINEのスマートスピーカー「WAVE」の特徴や、初期設定・各種設定などの使い方を紹介。先行体験版を用いた初期設定の事例を掲載;
LINEのスマートスピーカー「WAVE」の使い方(1)

生活家電やAV家電などを音声・言葉でリモートコントロールできるAmazon Echo、Google Home等のノ―ルックAI家電の製品例や技術を紹介;
ノールックAI家電






スマートスピーカー製品

スマートスピーカーは英語対応のAmazon Echoが最初に米国で発売されました。
音声を捉えるマイクロフォンが搭載されており、内蔵したスピーカーで音楽を再生したり、情報を知らせたりすることができます。
聞き取った音声は音声認識技術で処理され、更にクラウド上のインターネット情報と関連付けられてスマートスピーカーに伝えられます。 このように、スマートスピーカーは音声認識とAI(人工知能)による情報解析処理の技術がベースとなっています。
また、スマートスピーカーはWiFiの子機機能を内蔵しているので、 通常はホームネットワークの無線LANルーターに無線で接続され、 更にインターネットに接続されることになります。

また、Amazon EchoやGoogle Homeなどは、ノールックAI家電とも呼ばれていますが、 家庭内の家電製品を音声でリモート操作する事もできます。家電製品の専用リモコンやスマートフォン等でコントロールする場合とは異なり、 スイッチを入れたりアプリを立ち上げたりする必要が無いので、日常生活が更に便利で快適になります。

なお、音声認識技術を利用して機器と対話する機能は、iPhoneの「SIRI」やアンドロイド端末の「Googleアシスタント」のように、 既にスマートフォンでも利用されるようになっています。 しかし、スマートスピーカーは、わざわざ機器を用意して操作する必要が無いので、 便利なインターフェースとして広く普及していくと期待されています。
以下では、代表的なスマートスピーカー製品を取り上げて紹介していきます。


Amazon Echo
Amazon Echoは、2014年11月にAmazonから発売され、2016年に大ヒットした代表的なスカートスピーカー製品です。 音声は英語対応ですが、ドイツ語対応製品も発売されています。
Amazon Echoには次のようなラインナップがあり、発売されています。

  • 高品質なスピーカーを備えたフル機能の「Echo」(179ドル)(図2)
  • バッテリー内蔵で持ち歩きができる「Tap」(129.99ドル)
  • 外部スピーカーをBuluetoothや有線で接続して使う廉価版の「Dot」(49.99ドル)
  • カメラを搭載したAlexaデバイスの「Look」(199.99ドル)
  • タッチディスプレイを搭載した最も新しい「Show」(229.99ドル)

「Echo」は以下の図2に示したように円筒形の形状をしており、 搭載したスピーカーを用いて情報を伝えたり音楽を再生したりすることができます。 上部にはコントロール関係のボタンが配置されています。
また、音声を聞き取るためのマイクロフォンが備えられていて、 音声認識・処理を行う「Alexa(アレクサ)」と呼ばれるAIが働いており、これがAmazon Echoの中心技術となっています。

Amazon Echoは無線LAN(WiFi)でホームネットワークに接続されていますが、 通常は音声コマンドを待ち受けていて、音声命令があれば直ぐに対応するようになっています。
Amazon Echoが行える主な機能としては次のようなものがあります。

  • 音声コマンドに対して、音声情報をスピーカーから返す。
  • 天気やニュースなどインターネット上の様々な情報に対応している。
  • Gmailやカレンダーアプリと連携しており、スケジュールや予約等に答えてくれる。
  • 音楽サービスの「Amazon Prime Music」と連携して聴ける。
  • 照明や鍵、エアコンなどネット家電と連携しており、音声でリモート操作ができる。

これらはスマートフォンでも出来るようになっていますが、 Amazon Echoを利用すると部屋のどこにいても命令を口に出して言うだけで答えてくれます。
Amazon Echoのコマンドワードは「Alexa」になっており、始めにこの言葉を発してから命令を音声で伝えます。

Amazon Echoは様々な機器・製品やサービスとの連携を追加できるようになっており、 このプラグインは「Skill」と呼ばれています。このSkillを利用して連携を拡大していけるのが大きな特徴となっています。

<追記>
日本語対応のAmazon Echoが2017年11月に発売されました。 また、高機能な Amazon Echo Plus と、 小型モデルの Amazon Echo Dot も発売されています。
製品を入手するには、Amazonで購入申請を行い招待メールを受け取ってから購入できる面倒なシステムになっています。


図2 Amazon Echo 初期製品(直径8cm x 高さ23.5cm)

Amazon Echo


Google Home
Google Homeは、2016年11月にGoogleが米国で発売開始したスマートスピーカーです(価格は109ドル)。 Google Homeは現在、米国やカナダの他にイギリス、オーストラリア、フランス、ドイツで販売されており、 日本語対応の製品は2017年10月6日に発売されました。 また、小型化されたGoogle Home Miniも日本語対応製品が10月23日に発売されました。

Google Homeは図3のような形状をしており、スピーカーとマイクロフォンを搭載して、「Googleアシスタント」という音声認識AIが働いています。
Google Homeのコマンドワードは「OK Google」や「ねえ グーグル」になっており、始めのこの言葉を発してから命令を言います。

インターネット上の音楽配信サービス「Google Play Music」と連携する機能を持っているので、 音声で指示すれば希望の音楽を聴くことができます。

また、ネット家電との連携もできるので、音声でのリモートコントロールが可能です。
GooglecastやChromecastデバイスとも連携しており、音声でテレビを付けて配信映像を見ることができます。 また、Netflix等のアカウントとリンクすれば音声でこれらの映像コンテンツを見れます。
このようにテレビやスピーカーなど関連周辺機器との連携を進めています。

詳細は、以下のページをご覧ください。
スマートスピーカー「Google Home」の使い方

図3 Google Home 初期製品(直径9.6cm x 高さ14.3cm)

Google Home


HomePod
HomePodは、 「音楽の再生」に特徴を持ったApple社のスマートスピーカーです。 2017年12月に発売するとアナウンスされており、価格は349ドルで米国、イギリス、オーストラリアで発売予定です。
iPhoneにも搭載されている音声アシスタントの「Siri」により、Apple Musicの全機能を操作する事ができます。 例えば、Apple Musicのライブラリから好みに合わせたプレイリストや曲を選択する事ができ、 再生している曲のアーティストの情報を尋ねることもできます。

スピーカーは7つのビームフォーミングツウィータと、重低音のウーファを搭載しており、指向性の少ない音楽再生を行えます。 また、部屋の家具などの設置環境の音響特性を学習して音質を最適化できる特徴があります。
更に、ノイズキャンセリング機能を持つ6アレーのマイクを搭載して、 音楽を大音量で再生していても音声で操作が行える特徴があります。

HomePodの使い方としては、Siriを使ってメッセージを送ったり、ニュースやスポーツ、天気情報などを音声で確認することができます。 また、HomeKitを利用してネット家電(スマート家電)をコントロールする事ができ、音声で照明をつけたりAV機器の操作も行えます。
iOS11を搭載したiPhone5以降に対応しており、IEEE802.11a/b/g/nの無線LANを搭載してMIMOに対応、AirPlay2をサポートしています。

図4 HomePod(直径142mm x 高さ172mm、重量:2.5kg)

AppleのHomePod


Invoke(インボーク)
Invokeは、マイクロソフトの音声認識アシスタントである「Cortana(コルタナ)」を実装したスマートスピーカーです。 音響メーカーのHarman社との協業により開発されており、高音質が大きな魅力となっています。
以下の図5のようにグラファイトとパールシルバーの2色が用意されており、2017年秋に米国で発売予定となっています。

Invokeは3つのウーファと2つのツウィータを内蔵しており、フルレンジのサウンドを360度全方位に届けられ、 音楽の再生を快適に楽しめる仕様となっています。
音声認識についてはHarmanの音声認識技術「Sonique」を搭載しています。 また、7つのマイクを用いた360度アダプティブ技術、ビームフォーミング、エコーキャンセル、ノイズリダクション技術などによって、 騒がしい室内でもユーザの音声コマンドに反応するようになっています。

使い方としては、音楽の再生、予定の確認、ニュース・交通情報などの読み上げなど様々なアシスタントに対応しています。
また、コミュニケーションコンテンツのSkypeとの連携ができる特徴があり、電話やSkypeを利用できるデバイスとの通話が可能です。 更に、Cortana対応のスマートホームデバイスと連携して、照明器具や空調機器などを音声で操作する事ができます。

図5 Invoke

Invoke


Clova WAVE
Clova WAVEは、LINEとNAVERが共同開発したクラウドAIプラットフォームの「Clova(クローバ)」を搭載した日本語対応のスマートスピーカーです。
以下の図6のような形状をしており、話しかけると音声で会話したり、ニュースや天気などのサービスを聴くことができ、 家庭内の家電機器のオン・オフなどを音声でコントロールすることができます。
20Wのウーファー1台と5Wのツウィーター2台が搭載されており、ノイズキャンセリングマイクが4台搭載されています。 電源は12V/2.1Aですが、5000mAh/3.8Vのバッテリーも内蔵されています。

2017年秋にLINEから発売される予定の製品(15,000円)に先駆けて、限定された機能を持つ先行体験版(10,000円)が2017年8月に発売されました。 また、アプリの「Clova App」も提供されました。

Clova WAVEのシリーズ製品としては、LINEの人気キャラクターの形をしたスマートスピーカーClova Friendsが2017年12月に発売されました。
今後は、Clovaを搭載したスマートディスプレイ「FACE(フェイス)」も提供される予定です。

<追記>
Clova WAVEの正式製品版は10月5日に14,000円(税抜き)で発売されました。

AIプラットフォームのClovaと機器・デバイスやアプリをつなぐためのインターフェイスを用意して、 パートナーやサードパーティーと連携してプラットフォームを拡大していくことになっています。
特に、国内製品なので国内企業との連携や、LINE MUSICとの連携などに特徴を生かせます。

図6 Clova WAVE 初期製品(高さ:201.05mm、重量:998g)

WAVE


LINEのスマートスピーカー「Clova WAVE」の特徴や、初期設定・各種設定などの使い方は下記のページで紹介しています。 先行体験版を用いて設定の事例等も紹介。
LINEのスマートスピーカー「WAVE」の使い方(1)


Clarity
Clarityは、音声アシスタントのAlexaやGoogleアシスタントの両者が使える英語対応のスマートスピーカーです。
ニュースや天気を尋ねたり、音楽を聴いたり、スマートコントローラーとして例えば『ライトを消して』などのリモート操作が行えます。

Clarityは、図7のようにAndroidタブレットが内蔵されたタッチスクリーン(サイズは7インチ)の形状をしています。 音声で尋ねると、直ぐに画面に表示してくれるので確認ができます。
スピーカーは5W出力が2個搭載されており、1,600mAhのバッテリーを内蔵しているので持ち運んで使うこともできます。 価格は120ドル程度となっています。

図7 スマートスピーカー「Clarity」

スマートスピーカー「Clarity」





スマートスピーカーの特徴と問題点

スマートフォンよりも手軽に/気軽に使える
スマートフォンを用いると音楽の再生やニュースの表示などを音声で行う事もできます。 また、スマート家電(ネット家電)のリモートコントロールもスマートフォンのアプリで行う事ができますが、 スマートスピーカーの大きな特徴は、何か(例えば、スマートフォン)をわざわざ用意しなくても、 声を発するだけでサービスの利用や機器のコントロールができる点です。
このような「手軽さ」、「気軽さ」がスマートスピーカーの大きな価値となっています。
また、音声認識やAIなどの主要技術はスマートスピーカー本体では無くてクラウド側に置けるというのも大きな特徴です。 これは、スマートスピーカーのハードやソフトをシンプルにすることができ、販売価格の低減に役立っています。

どのスマートスピーカーがスタンダードになるか?
スマートスピーカーはAmazon Echoが最初に発売され、世界的には最も利用されていますが、 日本ではWAVEが最初に発売され、続いてGoogle Homeが発売されました。Amazon Echoも日本語対応製品が発売されますが、 それぞれの製品は独自の特徴を持っているので、利用方法によってユーザーが分かれてくると思われます。
例えば、WAVEはLINEツールとの連携や赤外リモコン製品のコントロールが可能です。 Google HomeはCromecastとの連携により動画再生を音声で操作できる特徴があり、 また、Googleアシスタントでの日本語認識技術の実績があります。 Amazon EchoはFire TVとの連携が可能で、Amazon Primeのサービスが利用できます。

コマンドワードの制約とセキュリティ問題
次に、スマートスピーカーを使用する際に問題となる点もあります。
例えば、コマンドワードの制約がその一つです。つまり、何かをする度にコマンドワードを言うのは面倒かも知れません。 Google Homeの場合は、「OK Google」と二言が必要になります。
また、部屋での会話の中にコマンドワードが出てくると、スマートスピーカーが反応してしまう事があります。 特に、買い物などの命令では注意が必要になります。
コマンドワードが発声されると、スマートスピーカーは必ず次の命令の「待ち受け状態」になっています。 この後の音声はクラウド上に記録されて解析される事になるので、日常会話が外部に漏れる恐れもあります。