特集

音声合成技術が切り拓く、新時代のキャラクタービジネス【特集第1回】

エンタテインメントにまつわる様々な分野のスペシャリストが集まり、ビジネスにおける幅広いソリューションを提供するソニー・ミュージックコミュニケーションズ(以下、SMC)。そんなSMCが手掛けた代表的な事例を、展示やトークセッションを通じて紹介するカンパニープレゼンテーション「w/」(with)が東京・秋葉原で開催された。

本特集では、様々な事例をテーマに、現場の担当者がトークセッションを行なう「Talk Crossing」を全8回にわたってレポートしていく。

特集第1回のテーマは、『キャラクター音声合成が切り開く新しい生活』。

近年、スマート家電やロボット、カーナビなどあらゆる分野に音声合成技術が使われている。SMCでは、エンタテインメントの領域でいち早く音声合成技術を活用。その技術の進化をたどるとともに、音声合成技術によって我々の生活がどう変わるのか、その未来を考察する。

音声合成技術を活用し、キャラクタービジネスを推進

SMCでは、文字情報を自動で読み上げるニュース配信システム「バーチャルアナウンサー 沢村碧」や、アニメのキャラクターと会話することができるスマートフォン(以下、スマホ)アプリ「めざましマネージャー」など、音声合成技術を活用したキャラクタービジネスを推進している。その中心メンバーが、SMCの松平恒幸さんだ。

松平さんは、ソニーの二足歩行ロボット「QRIO」の対話技術に携わってきた倉田宜典さんや、東芝で技術開発を行なうToSpeakチームとともに音声合成技術の進化・向上に努め、今では業界のトップランナーとして大きな存在感を示している。

ソニー・ミュージックコミュニケーションズ カンパニープレゼンテーション w/ 倉田宜典さん 松平恒幸さん

左からソニー株式会社 ブランドデザインプラットフォーム UX・事業開発部門
シニアテクニカルプロデューサー 倉田宜典さん
SMC マーケティング戦略本部 マーケティング戦略オフィス 松平恒幸さん

キャラクターとの音声会話には、音声を聞き取る「耳」、相手の言葉を理解して応答する「脳」、言葉を発する「口」の3つの機能が必要とされる。中でも注目されているのが、「脳」にあたる人工知能と「口」にあたる音声合成だ。

キャラクターと音声で会話する仕組み

“人工知能”は、さまざまなアルゴリズムや莫大な会話事例、人との会話によるトライ&エラーをもとに「おしゃべり」を生成する。アニメのキャラクターなど一定の人格に寄せた「おしゃべり」も可能だ。

“音声合成”は、不確定な情報、生成される情報や文章をしゃべる際に必要な音声システム。このふたつの技術を高めれば、キャラクターの声色・イントネーションで、より人間的な会話を行なうことができる。つまり、生きている人間に相対するのと同じように、キャラクターとの会話を楽しめるわけだ。

ちなみに、YouTube上で動画の配信を行なうキャラクター「VTuber」とは、仕組みがまったく異なっている。「VTuber」は、3DCGモデルをリアルタイムに動かしながら、その裏で生身の人間が声をあてている。それに対し、人間は介在せず、音声合成技術を用いて会話を成立させるのがキャラクター音声合成だ。

いかに自然に言葉を話すか。キャラクター音声合成の最先端

音声合成はスマート家電、ロボット、カーナビ、ゲームなどさまざまな分野で活用され、メガトレンドとして注目を集めている。2025年までに、世界市場で2,000億ドルに達するという試算もある。日本国内だけでも約1兆4400億円の市場規模になる見込みだ。

ソニー・ミュージックコミュニケーションズ カンパニープレゼンテーション w/ 倉田宜典さん

ただし、市場の成長には高度な音声合成技術が不可欠である。一聴して合成音声だとわかる機械的な声、不自然なイントネーションでは普及拡大は難しい。
「いかに文章をナチュラルに読み上げるか、文法を解析する技術とそれを音にするシンセサイジングの技術がカギになっています」と倉田さんは話す。


そんな中、SMC、ソニー、東芝が技術力を結集し、ブレイクスルーを起こしたのが2015年にリリースしたアプリ『めざましマネージャー アスナ』だ。

同アプリでは、大人気アニメ『ソードアート・オンライン』のヒロイン・アスナのビジュアルに、アスナ役の声優・戸松遥さんの声をもとにした合成音声を生成し、自然かつスムーズな会話を実現している。キャラクターの音声合成は、キャラクター設定、声優、音声合成テクノロジーの融合により成り立つものだが、その3要素を高次元で結びつけた成功例と言えるだろう。

「ロボットのような音声では、アニメ製作サイドに認めていただけません。アニメを製作したアニプレックスからも『これはアスナだ』と太鼓判を押していただけるところまで作り込みました」と松平さんも自信を覗かせる。

『めざましマネージャー』のキャラクターボイスは、収録音声と音声合成のハイブリッドである。どこが音声合成で、どこが収録音声かわからないほど自然な発話を実現しているのが特徴だ。「音声合成は、感情表現を苦手としています。必要に応じて収録音声を混ぜ、自然な発話に聞こえるように工夫しました」と倉田さんは話す。

その後も東芝のToSpeakチームとの協業により、音声合成技術は飛躍的に進化。2016年夏には、『ソードアート・オンライン』の足立慎吾さんがキャラクターデザインを担当し、人気声優・寿美菜子さんが声をあてる「バーチャルアナウンサー 沢村碧」が誕生し、大きな話題を呼んでいる。

ソニー・ミュージックコミュニケーションズ カンパニープレゼンテーション w/ 沢村 碧

音声合成の導入が進めば、キャラクターごとの差別化やカスタマイズのニーズも増えてくる。「かつて携帯電話の着信音を好みの音声に替えたように、今後は自分の好みに応じた“声”が求められるはず。好みに合った声、ニュアンス表現力、カスタマイズが重要になるでしょう」と松平さんは話す。

そんな松平さんの説を実証したのが、『Xperia Ear』だ。『Xperia Ear』は、耳元に装着してハンズフリーでコミュニケーションができる新しいスマートプロダクト。これまでスマホで行なっていたメッセージの送受信、電話、予定の確認などを、『Xperia Ear』に搭載されているアシスタントとの会話で行なうことができる。

SMCでは、このアシスタントの声をアニメ『ソードアート・オンライン』『冴えない彼女の育てかた』のヒロインに替えられるプラグインを制作。有料オプションとしては考えられないくらい高い比率でユーザーが購入したという。倉田さんも「正直ここまでとは予想しなかった」と驚いたほどだ。「音声インタラクションを好みの声に差し替えたい」というニーズを掘り起こすことで、キャラクター音声合成ビジネスはさらなる拡大が見込めそうだ。

アニメキャラがあらゆる場面で話す社会がやってくる!

成長が見込まれるキャラクター音声合成ビジネスだが、課題も残されている。

SMCが推進するエンタテインメント領域でのキャラクター音声合成の場合、「キャラクターの声の人格権を保有するライセンサーや声優・タレント事務所と音声合成を使用したいメーカー、サービサーとの契約に大きな課題がある」と松平さんは話す。現在はSMCが両者の仲介役を担っているが、前例のないビジネスだけにその都度問題をクリアし、知見をためているところだ。

ソニー・ミュージックコミュニケーションズ カンパニープレゼンテーション w/ 音声合成業界の構成と課題

キャラクター音声合成は、今後も新たなビジネスに発展する可能性を大いに秘めている。松平さんは、最後にこう締めくくった。

ソニー・ミュージックコミュニケーションズ カンパニープレゼンテーション w/ 松平恒幸さん

「キャラクターは、ファンのみなさんの愛によって支えられています。音声合成を利用することで、継続的にファンの愛を受け止めるサービスを生み出すことも可能です。2020年には海外から多くの観光客が来ます。その時、あらゆる場所でアニメキャラがしゃべるようになっていたら面白いのではないでしょうか。みなさんにもキャラクター音声合成をどのように活かせるか、ぜひ考えてみていただきたいです。みなさんのビジネスの知見とSMCのノウハウをかけあわせ、キャラクター音声合成ビジネスを発展させていければと思います」


カーナビやスマートスピーカー、ゲームなど、日常に浸透しつつある音声合成。その技術にキャラクターを載せれば、我々の生活はもっと楽しく快適になるはず。SMCが提案する、キャラクター音声合成が切り拓く新しい生活に今後も注目してほしい。

『めざましマネージャー』公式サイトはこちら
『バーチャルアナウンサー 沢村碧』公式サイトはこちら
『冴えない彼女の育てかた』×Xperia Ear公式サイトはこちら
『ソードアート・オンライン』×Xperia Ear公式サイトはこちら

特集2回目『大型イベントを成功させる秘訣とは?運営事務局ビジネスでそのメソッドを解く』はこちら

注目記事

Pickup

関連サイト

Related Sites

閉じる