CAVIARES: Corpus including Audio-Visual, Instructed, Affective Recordings of Empathetic Speech

ダウンロード (Download link):
SRC4VC_ver1.zip (Feb. 29: ver. 1 w/ 3.4 GB)

サンプルページ (Sample page):
Sample

概要:

CAVIARES コーパスは,マルチモーダル共感的対話音声合成技術の研究に向けて新たに構築された日本語コーパスであり,模擬対話音声と感情的読み上げ音声を含みます.
プロの日本語話者 1 名が演技し,発話中の顔の動き(MediaPipe Face Mesh)と同期して収録されています.
すべての発話には知覚に基づく感情ラベルが付与されており,音声と顔特徴量は時間的に整合されています.
本コーパスを用いる場合,以下の論文を引用してください.

Summary:

The CAVIARES corpus is a newly developed Japanese multimodal corpus for research on empathetic dialogue speech synthesis.
It includes both acted dialogues and expressive reading speech, spoken by a single professional female Japanese speaker with facial expressions captured.
Each utterance is annotated with perceived emotion labels and temporally aligned with dense facial landmark sequences extracted using MediaPipe Face Mesh.
If you wish to use this information in your paper, please cite the following paper:

収録物 (Contents):


更新情報 (Update information):

主な開発者 (Main developers):

謝辞 (Acknowledgements):