基于多模态智能交互的虚拟数字人|李晓明;张宾;魏晓鹏;孙喜民;刘丹;周晶 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

典型文献

基于多模态智能交互的虚拟数字人

文献摘要：

虚拟数字人是元宇宙中的重要虚拟角色,构建虚拟数字人需要完整复杂的技术体系.本文提供一个多模态的虚拟数字人进行实时交互,与传统的基于文本或语音的系统相比,多模态的数字人提供了类似于人类的交互(例如,生动的声音、自然的面部表情和身体姿势).用户给定一个语音请求,虚拟数字人能够在毫秒的延迟时间内响应高质量的回复.为了提供身临其境的用户体验,多模态智能交互虚拟数字人无缝集成了多模态技术,包括声学语音识别(automated speech recognition)、多轮对话、语音生成(text to speech)、虚拟数字人生成等人工智能技术.凭借庞大的知识库,多模态智能虚拟数字人能够与用户进行各个领域内容的多轮对话包括天气、设备控制、新闻推荐等,以及通过结构化知识回答问题.

文献关键词：

多模态;语音识别;语音生成;智能交互;虚拟数字人

中图分类号：

[1] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391）

[2] 文化、科学、教育、体育（G） / 教育（G4） / 电化教育（G43） / 计算机化教学（G434）

[3] 一般工业技术（TB） / 工业通用技术与设备（TB4） / 工业设计（TB47） / 产品设计（TB472）

作者姓名：

李晓明;张宾;魏晓鹏;孙喜民;刘丹;周晶

作者机构：

国网电商科技有限公司,北京100024

文献出处：

电力大数据

引用格式：

[1]李晓明;张宾;魏晓鹏;孙喜民;刘丹;周晶-.基于多模态智能交互的虚拟数字人)[J].电力大数据,2022(12):36-43

A类：

B类：

智能交互,虚拟数字人,元宇宙,虚拟角色,整复,一个多,实时交互,生动的,面部表情,身体姿势,请求,毫秒,延迟时间,回复,身临其境,用户体验,无缝集成,多模态技术,声学,语音识别,automated,speech,recognition,多轮对话,语音生成,text,知识库,设备控制,新闻推荐,结构化知识,答问

AB值：

0.35157

相似文献

采用STATCOM抑制多机系统次同步振荡的理论与仿真

毛俞杰;孙海顺;韩应生;吴思成;王东泽;朱廷猛-强电磁工程与新技术国家重点实验室(华中科技大学),湖北武汉 430074

多模型分层融合的配用电系统用户数据识别

蔡军;谢航;吴高翔;唐贤伦;邹密-重庆市复杂系统与仿生控制重点实验室(重庆邮电大学),重庆400065;国网重庆市电力公司电力科学研究院,重庆401120

基于RPA+AI的数字员工在电力行业的应用分析与架构设计

刘海涛;段敬;王艳花;顾玮;姚思蓓-国网山西省电力公司信息通信分公司,山西太原 030000

复杂大电网数字孪生构建技术及其在调度运行中的应用

周二专;张思远;石辉;严剑峰;吴倩红;杨延栋-电网安全与节能国家重点实验室(中国电力科学研究院有限公司),北京 100192;国网湖南省电力有限公司,湖南长沙 410004;国网新疆电力有限公司电力科学研究,新疆乌鲁木齐 830000

基于GFCC-SVM-RFE的电力设备声音特征提取方法