講演抄録/キーワード |
講演名 |
2019-03-08 14:40
敵対的生成ネットワークを利用した感情豊かな音声の生成 ○浅倉拓也・赤間俊介・山本昇志(都立産技高専) |
抄録 |
(和) |
現在,インターネットに接続可能な音声アシスタントデバイスが普及し始めており,見守りや介護などの,人とのコミュニケーションが重要な分野への適用が期待されている.これらのデバイスが今以上に社会に受け入れられるためには,人と同様の感情を持った対話機能が必要不可欠である.そこで我々は生成モデルの一種である敵対的生成ネットワークを利用し,無感情の音声から感情豊かな音声を生成する手法を開発した.本手法では音声の周波数や強弱などの情報を特徴量として抽出し,無感情音声の基本的特定を保ちつつ,感情表現に関係のある特徴を付与できるように工夫した.最終的には生成された音声を用いて,感情表現と音質に対する主観評価を実施した.その結果,本手法を用いることで特定の感情を有した変換が可能であることを確認した. |
(英) |
A voice assistant device with internet connection has been spread in the world. An efficient use of this device is expected in the communication field such as monitoring and nursing care for elder people. In order to obtain social acceptance for the voice assistant device more than ever, it is necessary to equip the function of intercommunication with emotional behavior similar to human. Therefore, we developed the learning-based method to attach an affective voice to emotionless conversation by using Generative Adversarial Networks (GANs). In this method, we first extracted emotional specifications such as frequency and strength from database. Next, we applied GANs with controlling the attachment of emotional specifications in order to keep the basic property of emotionless conversation. Finally, the subjective evaluation for emotional expression and tone quality was performed by using the generated voice samples. As the result, it is conformed that our method is possible to generate some emotional expression on its conversation. |
キーワード |
(和) |
情動 / 音声 / 機械学習 / ニューラルネットワーク / / / / |
(英) |
Emotion / Voice / Machine Learning / Neural Networks / / / / |
文献情報 |
映情学技報, vol. 43, no. 8, HI2019-58, pp. 37-40, 2019年3月. |
資料番号 |
HI2019-58 |
発行日 |
2019-03-01 (HI, 3DIT) |
ISSN |
Print edition: ISSN 1342-6893 Online edition: ISSN 2424-1970 |
PDFダウンロード |
|
|