Google アシスタントのウェイクワードは省略できるようになる?
音楽を聞いたり天気予報を確認したりと音声で必要な検索や操作を行う音声アシスタントの利用が増えてきています。
スマートフォンやスマートスピーカーに搭載されている音声アシスタントを動かすには、命令を認識するきっかけとなるウェイクワードの発話が必要です。
ウェイクワードだけで音声アシスタントが操作できるのは便利なポイントですが、ウェイクワードが省略できるようになると人に話しかけるように操作ができてさらに利便性が高まります。
この記事では、音声アシスタントの普及の状況やGoogleなどが行っているウェイクワードを省略する技術の開発状況を解説します。
音声アシスタントは今後増加の予想
音声アシスタントとは、人と対話して情報の検索や端末の操作などを行う機能のことです。
日本ではまだ普及の途上ですが、アメリカや中国などでは音楽再生の際などさまざまな場面で音声アシスタント機能が活用されています。
国内でも今後はスマートスピーカー利用の増加が予想されているのです。
ウェイクワードとは発話を認識する準備の言葉
音声アシスタントを操作するにはウェイクワードが欠かせません。
通常音声アシスタントは、近くで人が話す会話をすべて聞きとって判断しているわけではありません。
まずは保存されているウェイクワードだけを聞き取る準備をしていて、実際に発話された際に初めて音声認識ソフトが起動する仕組みになっているのです。
ウェイクワードの例には以下のようなものがあります。
・Apple:Hey Siri(ヘイ シリ)
・Microsoft :Cortana(コルタナ)
・Google:OK Google(オーケー グーグル)
ウェイクワードの便利な点
ウェイクワードはボタンを押して操作をしなくても必要な操作をしてくれるため、手が離せない場合やさっと操作をしたい場合に向いています。
また、AI活用することで使い続けることでより使いやすくなる点も魅力です。
音声アシスタントは運転サポートの分野でも活用
音声アシスタントは、一部の自動車の情報端末でも利用できます。
ハンドルから手を離さずに多くの操作ができるため、ドライバーが運転に集中できるようになります。
・Mercedes-Benz:Hi Mercedes(ハイ メルセデス)(*1)
・BMW:Hey BMW(ヘイ ビーエムダブリュ)(*2)
車載音声アシスタントの操作例
・エアコンの温度調整
・目的地までのルート検索
・○○のプレイリストをかける
・メンテナンス時期の照会
・この先の渋滞情報の取得
など
音声アシスタントは使えば使うほど精度があがる
音声アシスタントには、AI(人工知能)が搭載されています。
聞き取った音を分析して自分が持っているデータベースをもとに意味のある言葉として認識する工程に分かれます。
分析にはディープラーニングと機械学習が活用されています。
・ディープラーニング:膨大なデータベースをさまざまな切り口で分析し最も近いものを推定すること
・機械学習:どの特徴を抽出し何の観点で分析すると必要な答えが得られるかを自動で習得すること
つまり何度も音声アシスタントを使うことで、よく使う人の声の特徴や頻繁に使われる機能が認識されるため、より便利に活用できるようになるのです。
ウェイクワードの注意点
音声アシスタントは最初の段階ではどんな音声を処理すべきなのかを学習する時間が必要です。
学習が不十分な場合、話しかけていないのに音声アシスタントが反応して「よくわかりません」と返してくることがあります。
また、セキュリティ面への配慮も重要です。
学習のために蓄積している内容は確認できるため、場合によっては他人に聞かれたり別人に送信されたりする懸念があるのです。
ウェイクワード省略にかかわる研究開発状況
ここでは各音声アシスタントのウェイクワード省略に関する取り組みを見ていきましょう。
ウェイクワードを省略するにはコミュニケーションが必要
人間同士が会話をする場合、お互いが「今から話そうとしている」という状況を表情や身振りなどさまざまな情報から認識しています。
音声アシスタント利用時にウェイクワードを省略するためには、何かの情報で人が今から対話しようとしているということを検出しなければなりません。
例えばウェイクワードの省略には、同じ仕組みを音声アシスタントに取り入れるのも一案です。
この場合は、「人が対話しようとしていることを注視して、検知した場合に音声アシスタントを起動する」ことと「対話しようとしている人に対して「今注視している」ことを表示する」必要があります。
Google アシスタントのウェイクワードは「OK Google」
ここではGoogleやAmazonのウェイクワードに関する技術動向について紹介します。
Google アシスタントで操作できるもの
Google アシスタントでは、スマートフォン・スピーカー・スマートディスプレイ・テレビ・ウェアラブルなどが操作可能です。
「アート&ライフスタイル」「ゲーム&娯楽」などカテゴリは18種類あり、以下のような操作ができます。(*3)
・用事を管理する
・予定を立てる
・エンタメを楽しむ
・思い出をつくる
・調べ物をする
GoogleのGuacamoleはウェイクワードの省略技術の可能性
Googleが開発しているアプリのβ版にGuacamole(ワカモレ)という機能が表示されています。
このことからGoogleでは何らかの社内テストが開始されていることが想定されているのです。
Guacamoleには発話をイメージするアイコンが割り当てられて「Quickly get things done with Guacamole(ワカモレでものごとをすばやく終わらせる)」と表示されています。
また、ボイスショートカットとして、「Skip saying “Hey Google” for help with quick tasks(クイックタスクのヘルプについて「ヘイ Google」と言うのをスキップ)」と説明が加えられているのです。
2021年6月時点ではGuacamoleについて公式リリースがなく、「電話に応答」「アラーム・タイマーの音を消す」などGoogle アシスタントの音声入力の一部がショートカットできる機能の発表が期待されています。
Amazonのウェイクワード関連の取り組み
一方Amazonでは、ウェイクワードの省略機能がすでにリリースされています。
2021年には自社ブランドごとに音声エージェントを個別に作成できる「Alexaカスタムアシスタント」を発表するなど音声アシスタント機能の開発に力を入れているのです。
Alexaはウェイクワード省略が可能
Alexaには、すでに「会話継続モード」が搭載されています。
オーディオ再生中を除き「会話継続モード」をオンにしていると、数秒間はウェイクワードを付けずに「○○して」という発話だけで操作が可能です。
また、「止めて」「キャンセル」「ありがとう」などAlexaとの会話を終えるコマンドを投げかけると終了します。(*4)
Project Aliasでウェイクワードを任意に
Amazonが開発しているAliasは、ウェイクワードを任意の言葉に変更できるデバイスです。
拡張ボードとスピーカーで構成されていてAmazon EchoやGoogle Homeにかぶせて使用します。
音声アシスタントのウェイクワードを帰るほか、機械学習用に本体で蓄える音声の不正使用対策にも活用可能です。
まとめ
音声アシスタント機能はGoogleなど各企業で開発が進められています。
発話の際にウェイクワードを使うのは便利な反面ときには面倒と感じる場合もあり、各社ウェイクワードを省略について研究開発を行っている様子が伺えます。
Google アシスタントでもウェイクワードの省略技術が研究されています。
今後はさらに音声アシスタント機能の利便性が高まることが予想されているのです。
大手ゼネコンBIM活用事例と 建設業界のDXについてまとめた ホワイトペーパー配布中!
❶大手ゼネコンのBIM活用事例
❷BIMを活かすためのツール紹介
❸DXレポートについて
❹建設業界におけるDX
▼キャパの公式Twitter・FacebookではITに関する情報を随時更新しています!
参考URL
*1 https://www.yanase.co.jp/mercedes-benz/mbux/
*2 https://www.bmw.co.jp/ja/topics/brand-and-technology/intelligent_personal_assistant.html
*3 https://assistant.google.com/explore?hl=ja_jp
*4 https://www.amazon.co.jp/gp/help/customer/display.html?nodeId=202201630