首站-论文投稿智能助手
典型文献
基于多模态智能交互的虚拟数字人
文献摘要:
虚拟数字人是元宇宙中的重要虚拟角色,构建虚拟数字人需要完整复杂的技术体系.本文提供一个多模态的虚拟数字人进行实时交互,与传统的基于文本或语音的系统相比,多模态的数字人提供了类似于人类的交互(例如,生动的声音、自然的面部表情和身体姿势).用户给定一个语音请求,虚拟数字人能够在毫秒的延迟时间内响应高质量的回复.为了提供身临其境的用户体验,多模态智能交互虚拟数字人无缝集成了多模态技术,包括声学语音识别(automated speech recognition)、多轮对话、语音生成(text to speech)、虚拟数字人生成等人工智能技术.凭借庞大的知识库,多模态智能虚拟数字人能够与用户进行各个领域内容的多轮对话包括天气、设备控制、新闻推荐等,以及通过结构化知识回答问题.
文献关键词:
多模态;语音识别;语音生成;智能交互;虚拟数字人
作者姓名:
李晓明;张宾;魏晓鹏;孙喜民;刘丹;周晶
作者机构:
国网电商科技有限公司,北京100024
文献出处:
引用格式:
[1]李晓明;张宾;魏晓鹏;孙喜民;刘丹;周晶-.基于多模态智能交互的虚拟数字人)[J].电力大数据,2022(12):36-43
A类:
B类:
智能交互,虚拟数字人,元宇宙,虚拟角色,整复,一个多,实时交互,生动的,面部表情,身体姿势,请求,毫秒,延迟时间,回复,身临其境,用户体验,无缝集成,多模态技术,声学,语音识别,automated,speech,recognition,多轮对话,语音生成,text,知识库,设备控制,新闻推荐,结构化知识,答问
AB值:
0.35157
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。