音声検索を比較、最強のアシスタントとは
音声検索といえば、かつてはAppleのSiriだけでしたが、スマートスピーカーの登場によりAmazonのAlexa、LINEのClova、そしてGoogleアシスタントと比較対象が増えました。さらにパソコン上ではマイクロソフトのCortana(コルタナ)もあります。といっても、複数のガジェットで音声検索をすることは少ないのではないでしょうか。
検索エンジンという言葉を世の中に広めたのは、Googleといっても過言ではありません。Yahoo!が1994年に人力で情報を収集したディレクトリ型の検索エンジンを開発したことが検索エンジンの発端といわれます。しかし、その後、1998年に検索窓だけが表示された画期的なGoogleにより、急速にGoogleの人気が高まりました。分からないことがあると、辞書を引くより検索エンジンで調べることが一般的になりました。
現在ではさらに「検索窓にテキストでキーワードを入れる」手間がなくなり、声をかけて答えを得る音声検索が一般化しつつあります。
さまざまな音声検索で調べられることを整理、比較してみましょう。
音声検索の種類と概要
まず、音声検索の種類と概要を整理します。
Siri
Appleの製品に搭載された対話型人工知能です。当初はiOS上だけで使うことができましたが、macOS SierraからMacでも利用できるようになりました。2007年に創立されたSiri社を買収することで、Appleブランドの技術のひとつになった経緯があります。iPhoneなどのハードウェアとの一体化が他の音声検索との大きな差別化ですが、裏返せば現状ではApple製品以外では使えないことがデメリットといえます。ウェイクワード(起動するときの言葉)は「Hey! Siri」。
Alexa
2014年にスマートスピーカーの「Echo」と同時に発表した、Amazonによる対話型の人工知能です。音声機能はスキルと呼ばれますが、開発者向けにクラウド上のAmazonの技術を使って独自製品を開発できるAlexa Voice Service(AVS)を無償で提供しています。また、Amazon Lexとして音声認識ならびに自然言語処理の技術を開発者に提供し、独自のチャットボットとして活用できる可能性を拡げました。ウェイクワードは「Alexa!」。
Clova
日本ではAmazonやGoogleに先駆けて2017年の10月から発売された、スマートスピーカー「Wave」に搭載された対話型人工知能です。日本では利用者の多いLINEと親和性が高く、スピーカーに呼びかけてLINEのメッセージを送信できます。ウェイクワードは「Clova!」で、アプリから「Jessica(ジェシカ)」に変更することもできます。
Googleアシスタント
2016年にスマートスピーカー「Google Home」とメッセージアプリ「Allo」とともに発表されました。GoogleはSiriに追随する人工知能によるアシスタント機能としてAndroid用にGoogle Nowを検索機能の拡張版として提供していましたが、Googleアシスタントでは双方向の対話を可能にしています。2017年5月からはiOSに独立したアプリとして提供を始めました。ウェイクワードは「OK Google」。
Cortana(コルタナ)
マイクロソフトのWindowsに搭載された音声検索のアシスタント機能です。2015年11月のアップデートから、Windows 10で日本語による利用が可能になりました。他の音声検索より有用な場面としては、やはりPC上のファイルを検索することかもしれません。音声だけでなく検索窓からテキストの入力もできます。設定画面で「コルタナさん」と呼びかけて、起動させることができるようになります。
音声検索で調べることができること、最強のアシスタントとは
まず、音声検索で最も多く使われる質問は「今日(明日)の天気」ではないでしょうか。どのアシスタントでも現在位置情報と合わせて、現在の天気や気温を音声で回答します。Googleアシスタントで現在の天気を質問すると、テキストで「気持ちよく晴れています」と音声以外の回答もします。
時計がない部屋にClova WAVEのようなスマートスピーカーを置いている場合、意外に役立つのが「いま何時?」です。SiriやGoogleアシスタントでは「ニューヨークではいま何時?」のように、外国の時間を質問することもできます。また、西暦と和暦の換算、外貨の換算も便利です。
現在地の位置情報を組み合わせると、目的地までの道のり、近くのコーヒーショップ(あるいはトイレ)は実用的です。この場合、個人的な見解ではGoogleマップをよく利用するので、Googleアシスタントに軍配を上げたいところでしょうか。
そこで、理想の音声検索の条件を考察して、5つ列記します。
- 誤動作や「分かりません」と回答しないこと。
- 検索結果が正確。検索エンジンの検索結果の一覧を表示させないこと。
- 検索時間が短いこと。音声応答のレスポンスが迅速なこと。
- 質問の語順に関わらず、言葉の曖昧さを汲み取って回答が得られること。
- 質問によっては、遊び心のあるUXを提供すること。
有能な人間のアシスタントのように、感情まで汲み取って回答してくれる日がやがて来るのでしょうか。
▼キャパの公式Twitter・FacebookではITに関する情報を随時更新しています!