Download らくらくスマートフォン向けしゃべってコンシェルの開発

Transcript
らくらくスマートフォン向けしゃべってコンシェルの開発
らくらくスマートフォン
音声エージェント
UI
NTT DOCOMO Technical Journal
らくらくスマートフォン向け
しゃべってコンシェルの開発
スマートフォンの機能やサービスをより幅広いユーザに
利用いただける環境づくりをめざし,「らくらくスマート
サービス&ソリューション
開発部
う ち だ
わたる
内田
渉
お お の ぎ
みどり
大野木 碧
フォン(F-12D)
」向けの「しゃべってコンシェル for らく
らく」をバージョンアップした.バージョンアップではユ
ーザ評価実験による課題抽出結果に基づき,UI の刷新を行
った.また,端末の使い方や各種サービスに関する質問に
答えるため,取扱説明書アプリ「使いかたガイド」ならび
にドコモ Web サイトの「よくあるご質問(FAQ)
」との連
携機能を開発した.
くらくVer.1.1」として2013年1月に
った.方針②についてはドコモの
提供を開始した.改修にあたって次
Webサイト上のお客様サポートの一
近年,大画面やタッチパネルを活
の 2 つの方針で開発を行い,進化す
環として提供している「よくあるご
用した UI,高速な CPU や進化した
るスマートフォンの機能をより幅広
質問(FAQ)
」[1],ならびに取扱説
無線ネットワークを備えたスマート
いユーザに利用いただける環境づく
明書アプリ「使いかたガイド」[2]と
フォンが普及し,その特徴を活かし
りを試みた.
の連携機能を実装した.
1. まえがき
たサービスも次々と登場している.
方針①:音声発話によるスマート
高いリテラシをもつユーザが魅力的
フォン操作をより自然に実施できる
な新機能や新サービスを使いこなす
ようにする.そのため UI をさらに
一方,シニアユーザを含む,新機能
直感的に使えるように変更する.
本稿では上記の 2 つの取組みにつ
いて解説する.
2. 直感的な UI への
変更
の利用に必ずしも積極的ではないユ
方針②:スマートフォンの使い方
ーザもスマートフォンを使い始めて
に関する疑問や問題の解決を支援す
しゃべってコンシェルの操作で難
おり,そのようなユーザでも使いや
る.そのために端末機能やサービス
しい点や分かりづらい点を把握する
すい機能やサービスへのニーズが高
内容に関する質問に回答する機能を
ため,NTT サービスエボリューシ
まっている.
追加する.
ョン研究所ICTデザインセンタの協
そこでらくらくスマートフォン
力のもと,シニア層のユーザを対象
(F-12D)向けに提供している音声エ
方針①について,シニア層のユー
ージェントサービス「しゃべってコ
ザを被験者とした UI に関する評価
ンシェル for らくらく Ver.1.0」を改
実験を行い,結果から抽出した課題
修し,
「しゃべってコンシェル for ら
の解決を図る UI の設計と実装を行
とする評価実験を行った.
2.1 実験概要
被験者は,スマートフォンおよび
 2013 NTT DOCOMO, INC.
本誌掲載記事の無断転載を禁じます.
40
NTT DOCOMO テクニカル・ジャーナル Vol. 21 No. 2
NTT DOCOMO Technical Journal
しゃべってコンシェルの利用経験の
と,メール作成画面に遷移し,アプ
1 点目の課題「使い方の流れが分
ない50∼60代の男女6名である.実
リの音声応答で宛先,本文の順に発
からない」に対応するために,マイ
験では被験者にいくつかの機能に関
話を促す.しかし,被験者の中に
クボタン押下・発話・結果表示の流
する課題を提示し,改修前のアプリ
は,宛先を発話すべき画面で本文の
れが分かるように図 1 のとおり画面
を使って取り組んでいただいた.例
みを発話してしまうなど,発話すべ
デザインを変更した.まず,トップ
えば,「外出先で○○の場所を調べ
き内容を誤ってしまう様子が観察さ
画面のマイクボタンのサイズを大き
る」というような地図検索や,メー
れた.しゃべってコンシェルはエー
くし,さらに点滅させることで,ボ
ル,天気,グルメ検索などの機能に
ジェントの音声応答とユーザの発話
タン押下を促すようにした(図 1
ついて実験を行った.
で操作できるように UI を設計して
(a)
)
.また,音声認識画面は大きく
いるが,ユーザが音声応答を聞き逃
ダイアログを示し,発話すべき場面
した場合や,すぐに理解できなかっ
であることを明確にした(図1(b)
)
.
た場合のフォローが必要であると考
さらに結果画面については,追加の
えられる.
発話が必要ない場合はマイクボタン
2.2 実験結果
実験の結果から 3 つの課題を抽出
した.
を非表示とし,ユーザが誤って操作
課題①:使い方の流れが分から
ない
音声により機能呼出しや情報検索
をするためにはマイクボタンの押下
が必要だが,その操作をせずに話し
かけてしまう行動が観察された.こ
2.3 課題の解決
することを防ぐようにした(図 1
2.2 に示した課題を解決するため
(c)
)
.
変更②:発話例の表示
に下記のようにUIを変更した.
変更①:画面デザイン変更による
2 点目の課題「発話文を思いつか
ない」に対応するために,図 2 のと
操作方法の明確化
れはユーザがアプリの基本的な使い
方の流れを理解できていないことに
起因すると考えられる.
課題②:発話文を思いつかない
使い方の流れがわかったとして
変
更
前
も,具体的な発話文を思いつかずに
マイクボタン押下後に考え込んでし
まう行動が観察された.これは,し
ゃべってコンシェルで使える機能
や,それらを呼び出すための話しか
けかたが十分に認知されていないた
めと考えられる.
課題③:繰返し発話が必要な場合
変
更
後
の使い方が分からない
乗換案内,メール,電話,メモな
どの一部の機能については,繰返し
マイクボタンは
大きく・点滅
発話すべき場面で
あることを明確化
必要ない場面では
マイクは非表示
発話することで初めて実行できる
(a)トップ画面
(b)音声認識画面
(c)結果画面
UIも提供している.例えばメールの
図 1 使い方を明確化した画面デザイン
場合「メールしたい」と発話する
NTT DOCOMO テクニカル・ジャーナル Vol. 21 No. 2
41
らくらくスマートフォン向けしゃべってコンシェルの開発
おり代表的な機能とその機能を呼び
かでも Web サイトの形で即座に回
動作の流れを図 5 に示す.ほとん
出すための発話例を表示するように
答が得られること,料金やサービス
どの処理は従来のしゃべってコンシ
変更した.アプリのトップ画面で一
の受付け方法などさまざまな情報を
ェルと同じである[3].
定時間以上マイクボタン押下がない
1 カ所に集約していることから,サ
サービスに関する質問をするとク
場合,発話例が表示される.
ービスに関するユーザの疑問や問題
ラウド上のしゃべってコンシェルサ
の解決を支援するために FAQ との
ーバへ情報が伝えられる(図 5 ①)
.
連携機能を実装した.
しゃべってコンシェルサーバには音
変更③:ボタンのワーディングに
NTT DOCOMO Technical Journal
よる繰返し発話の誘導
3 点目の課題「繰返し発話が必要
FAQとの連携時の画面を図 4に示
な場合の使い方が分からない」に対
す.トップ画面(図 4(a)
)で「利
音声認識機能は音声をテキスト表現
応するために,ユーザが操作するボ
用中断について教えてください」な
に変換する(図5②)
.意図解釈機能
タンのワーディングを変更した.
ど携帯電話サービスに関する質問を
はテキストの傾向を判断して処理を
図 3 にメール機能の宛先入力画面
行うと,FAQの検索結果ページを取
引き継ぐタスク(端末機能やサービ
の例を示す.図 3(b)に示すとお
得し画面内に表示する(図4(b)
)
.
ス)と検索条件を決定する(図 5
り,宛先を入力する場合は,マイク
ボタンのワーディングを「宛先をし
ゃべる」とし,発話すべき内容を明
確にした.
3. 端末機能やサービス
内容に関する質問に
回答する機能の追加
3.1 よくあるご質問(FAQ)
との連携
「よくあるご質問(FAQ)
」
(以下,
(a)変更前
図3
(b)変更後
ボタンワーディング変更例
FAQ)はドコモの Web サイト上で
提供している,ユーザから寄せられ
る問合せの中からよくあるご質問と
その回答を掲載した Web サイトで
ある.ドコモはさまざまなユーザサ
﹁
教利
え用
て中
く断
だに
さつ
いい
﹂て
ポートの取組みを行っているが,な
(a)しゃべってコンシェル
for らくらく トップ画面
図2
42
声認識機能と意図解釈機能があり,
発話例の表示画面
よくあるご質問
(FAQ)と連携し
検索結果を表示
(b)よくあるご質問(FAQ)
検索結果画面
図 4 よくあるご質問(FAQ)との連携イメージ
NTT DOCOMO テクニカル・ジャーナル Vol. 21 No. 2
NTT DOCOMO Technical Journal
③).動作の指示が端末アプリケー
ホームページ上などで提供してい
実装した.「使いかたガイド」との
ションに伝わり(図 5 ④),FAQ サ
る.その中でも「使いかたガイド」
連携イメージを図 6 に示す.「マナ
イトの検索結果を取得する(図 5
は最も網羅的に情報を確認可能であ
ーモードの設定方法」など,機能の
⑤)
.以上が FAQ との連携時の動作
ることとともに,検索機能を具備し
使い方や設定方法に関する質問を行
の流れである.
ており必要な情報を即座に表示可能
うと,使いかたガイドを検索キーワ
意図解釈はタスク判定とキーワー
であるという特長がある.そこでユ
ードとともに起動する(図 6(b)
)
.
ド抽出の 2 つの機能から構成され
ーザの端末機能や設定方法に関する
使いかたガイドは検索キーワードを
る.タスク判定はテキストに変換さ
疑問や問題の解決を支援するために
使ってアプリ内部のコンテンツを検
れたユーザの発話文章をもとに,多
「使いかたガイド」との連携機能を
索し,1 件の場合はそのページを直
*1
*2
クラス分類 と呼ばれる機械学習
の手法を用いて,ユーザの要求に応
ユーザ端末
しゃべってコンシェルサーバ
えるために適切なサービスや機能が
タスク判定
●サービスに
①
関する質問
何であるかを判断する.今回の開発
では乗換案内などこれまで提供され
音声認識
ていたタスクに加え,料金や手続き
●よくあるご質問
④
(FAQ)サイト
取得の指示
方法などサービスに関する質問が行
われた際に FAQ を適切なタスクで
あると判断するように多クラス分類
の動作を変更した(図5(③-1)
)
.
キーワード抽出はタスク判定で決
しゃべってコン
シェルforらくらく
アプリ
意図解釈
キーワード抽出
③ -2)質問文からよ
●音声をテキ ●
②
③よくあるご質問 (●
ストへ変換 (FAQ)表示の判断 くあるご質問(FAQ)
と検索条件の決定 に入力する検索キー
ワードを決定
⑤検索結果
●
ページの取得
よくある
ご質問
(FAQ)
サイト
定されたサービスや機能それぞれに
対して,適切な結果を得るための検
索条件などを設定する機能である.
(●
③ -1)質問文の傾向
からよくあるご質問
(FAQ)が適切と判断
図 5 よくあるご質問(FAQ)連携時の動作の流れ
今回は FAQ の接続先 URL や検索キ
ーワードの設定などを行うように機
能を追加した.検索キーワードとし
(a)しゃべってコンシェル
forらくらく トップ画面
(b)使いかたガイド
ては,発話中に出現したサービス名
称や,サービス名称と一緒に発話さ
れることが想定される「料金」など
の単語を抽出することとした(図 5
(③-2)
)
.
3.2 使いかたガイドとの
連携
「使いかたガイド」は端末の使い
﹁﹁
赤ブ
外ッ
線ク
マ
のー
使ク
いの
か登
た録
﹂方
法
﹂
(b-1)説明画面
(結果一件の場合)
(b-2)検索結果一覧画面
(結果複数の場合)
方や設定方法を確認できるアプリケ
ーションである.ドコモは使い方や
図 6 使いかたガイドとの連携イメージ
設定方法に関するさまざまな情報を
* 1 多クラス分類:事例の統計処理により得
られた判断基準に基づいて,入力情報の
集まりを複数のグループに分類する手法.
* 2 機械学習:事例を基にした統計処理によ
り,計算機に入力と出力の関係を学習さ
せる枠組み.
NTT DOCOMO テクニカル・ジャーナル Vol. 21 No. 2
43
らくらくスマートフォン向けしゃべってコンシェルの開発
接表示し(図 6(b-1)
)
,結果が複数
タスク判定については端末の使い
まれることが多く,また同じ意味で
あった場合はそれらをリスト表示す
方に関する質問が行われた際に「使
もさまざまな単語で表現される.こ
る(図6(b-2)
)
.
いかたガイド」を適切な機能である
れらの単語をすべて利用し使いかた
と判断するようにクラス分類モデル
ガイドのコンテンツを検索した場
を変更した.
合,検索結果が 0 件になることが頻
動作の流れを図 7 に示す.FAQと
NTT DOCOMO Technical Journal
の連携と同じくタスク判定・キーワ
ード抽出機能へ機能追加を行い,使
次に,キーワード抽出について述
発し,ユーザは使いづらさを感じ
いかたガイドアプリケーションを起
べる.自然な音声発話文には検索キ
る.そこで,発話から抽出したキー
動するようにした.
ーワードとして有効な単語が複数含
ワードを取捨選択し,発話に完全に
ユーザ端末
しゃべってコンシェルサーバ
タスク判定
●端末機能に
①
関する質問
音声認識
⑤起動
●
意図解釈
●使いかたガイ
④
ド起動の指示
使いかた
ガイドアプリ
キーワード抽出
●音声をテキ
②
ストへ変換
しゃべって
コンシェル
forらくらく
アプリ
図7
(③ -1)質問文の傾
向から使いかたガイ
ドが適切と判断
●使いかたガイ
③
ド起動の判断と
検索条件の決定
(③ -2)質問文から使
いかたガイドに入力
する検索キーワード
を抽出
使いかたガイド連携時の動作の流れ
質問文入力
キーワード候補抽出
検索結果件数推定
推定検索結果数>1?
No
キーワード候補を
1件削除
Yes
現在の候補を検索
キーワードとする
図8
44
キーワード選定処理の流れ
NTT DOCOMO テクニカル・ジャーナル Vol. 21 No. 2
回答できる内容が使いかたガイドに
果件数を推測する.検索結果件数が
今後はリリース後の利用状況調査
ない場合でも,近い内容のページを
0 件の場合はキーワードを 1 つ削除
を踏まえ,より簡単にスマートフォ
最低 1 件表示できる場合だけ使いか
し,残りのキーワードで再度検索結
ンを利用いただくための取組みを継
たガイドへ遷移するように制御する
果件数を推測する.これを検索結果
続的に実施する予定である.
キーワード選定処理も実装した.キ
が 1 件以上になるまで繰り返し,最
ーワード選定処理の流れを図 8 に示
後に残ったキーワード集合を使って
す.
NTT DOCOMO Technical Journal
使いかたガイド内部のコンテンツ
検索結果の件数を推定できるよう
文 献
使いかたガイドを起動する.
[1] NTTドコモ:“よくあるご質問
(FAQ)
.”
4. あとがき
[2] NTT ドコモ:“わかりやすい操作説明
http://faq.nttdocomo.co.jp/faq/
への取組み|お客様サポート| NTT
に,各ページと,それを検索するた
スマートフォン機能やサービスを
めのキーワードの対応関係をリスト
より幅広いユーザにご利用いただく
http://www.nttdocomo.co.jp/support/
化してしゃべってコンシェルサーバ
ことをめざした,「らくらくスマー
trouble/manual/download/guide/
に保持しておく.発話から抽出した
トフォン(F-12D)
」向けのしゃべっ
キーワード候補の集合と使いかたガ
てコンシェルのバージョンアップに
語処理,” 音声言語情報処理 2012-SLP-
イド検索表を照らし合わせ,検索結
ついて解説した.
93(4), pp.1-6, 2012.
NTT DOCOMO テクニカル・ジャーナル Vol. 21 No. 2
ドコモ.”
index.html
[3] 吉村 健:“しゃべってコンシェルと言
45