讯飞音乐首席科学家江源受邀出席2023中国数字文娱行业大会

2023-03-28 18:17:55     来源:

 

3月22日,以“数字技术引领文化娱乐行业高质量发展”为主题的“2023中国数字文娱行业大会暨中国文化娱乐行业协会数字文娱分会成立大会”在广州天河隆重召开。会上,讯飞音乐首席科学家江源发表了《人工智能驱动数字产业创新发展》主题演讲,深入探讨人工智能在数字经济以及数字文娱发展中的应用方向。

数字经济催生场景革命,线下场景线上化正在快速崛起,在这样的场景中怎样进行人机交互以及人人交互将是智能人机交互技术生存的基础。基于此,江源从技术角度出发对数字经济场景中智能人机交互的三大关键要素进行定义:

基于多传感器的多模感知能力,即人工智能能否充分的感知用户的表达。结合各类数据和知识的深度理解能力,即人工智能能否全面的理解用户的意图。跨终端界面呈现的多维表达能力,即人工智能能否准确地传递和表达信息。

作为中国人工智能技术创新型企业,科大讯飞在自主构建的“智能人机交互技术框架”中,将技术分为物理展现层、表达层、理解层、感知层:从基本的物理传感器开始,获取人的感知,通过多维的的单项能力技术去拆解信息诸元,并在感知层融合决策,再到理解层结合用户画像和历史对话形成回答,最后在表达层通过多维的信息通道向人传递。这是整个人机沟通的处理链路,每一个模块都是基础的人工智能技术单元,通过复杂组合形成完整的人机交互流程。

在感知技术方面,传统人机交互最行之有效的手段是键盘,但这并不符合人和人交流的习惯。机器想更自然地与人类进行交互,需要通过听觉、视觉、语义以及各种传感器的组合去获取更多的有用信息,即从“单模态感知”发展到“多模态感知”,逐步拟人化。

车载的应用场景是多模态感知典型案例之一,人通过语音控制车机的技术经过10多年的发展已经有了长足的进步,通过进一步结合基于多模态融合的“免唤醒多模态交互系统”:如车机可以通过感知视线,识别司机有没有犯困需要休息;通过唇形识别排除其他乘客发言,提升司机语音识别抗噪性,以此显著提升算法效果和用户体验。

在深度理解技术方面,科大讯飞提出基于场景事理图谱的主动交互系统,机器可以主动发起沟通,激起人的交互欲望。这个系统目前已经在儿童陪伴性玩具上得到测验:在面对小朋友孤单时,AI能主动且从容地说出“我们来玩猜谜语吧”,更具人情味。可以说,在未来的儿童伴侣型机器人以及老人陪伴型机器人上,这种主动的交互认知理解技术会大有可为,未来可期。

在多维表达技术方面,基于听感量化编码的语音属性解耦技术,可以对声音实现从情绪到音色的细致调节。除了声音以外,形象的多维表达在数字娱乐领域应用广泛。针对捏脸技术,科大讯飞开发出具有数字序列传达能力的真人型捏脸技术,通过声音驱动真人做容貌上的改变,再通过语音去驱动口唇、动作、表情的表达。

“打造视听触等多通道感知融合的高沉浸人机交互是数字经济发展的必然趋势。”江源说,人工智能技术的不断进步,会持续提升用户对数字经济场景的体验,带来更沉浸式的感官体验、更加丰富多彩的虚拟内容。“其中虚拟人行业是数字经济落地的重要抓手和先锋。”

关于人工智能技术落地虚拟人行业,江源分享了典型案例——讯飞音乐旗下首位AI虚拟歌手Luya。

讯飞音乐通过特有的X-Vocal音色创造、AI变声&歌曲合成、Smart-tts说话合成、AI词曲及立绘生成、AI驱动动作及表情等技术,对讯飞音乐旗下首位AI虚拟歌手Luya进行相应的打造与包装。在X-Vocal音色创造技术上,讯飞音乐通过海量人声数据构建出一个人类物理发声空间,在这个空间里通过多维信息解构,定义出人对声音的主观感知标签,再利用对这个标签信息量的控制调节,就可以自由地组合创造出不依赖于具体某个人的全新音色。Luya的音色,就是讯飞音乐的技术人员同产品运营、音乐界专家细致处理并调节出的独一无二的创造音色。

作为成长型歌手,去年8月Luya团队与上海音乐学院合作,加入上海音乐学院“音乐工程系·讯飞音乐 联合研发中心”,开展AI融合音乐的创新探索,获得粉丝、媒体广泛关注,登上微博、抖音、快手、B站等多平台热搜榜,及环球时报、解放日报等媒体专题报道。

截至目前,AI虚拟歌手Luya已推出《迷雾之中的微光》《铠甲》《SO HOT》《新年元气曲》等20余首原创歌曲,其中多首作品进入音乐平台热榜。随着AI能力的提升,Luya仍在不断突破自己能力的象限,未来值得期待。

江源表示,“随着虚拟现实、人工智能、云计算、5G等技术与文娱产业走向深度融合,技术驱动应用的前景广阔也道阻且长。在这里,我期待跟各位业界同仁携手,共同促进数字经济的健康发展。”

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

标签:

猜你喜欢

哔哩哔哩公益上线多个女童保护项目,关注青少年健康成长
安全有保障,效率大提升 | 超千点麒麟信安云在长沙某银行稳定运行!
“绿动未来,行摄自然之美”首届爱普生大学生摄影作品大赛圆满收官
按下出海“加速键” 康立明生物长安心®展现勃勃生机
秦朔:高歌猛进时代结束,生产性创新时代开启
华为盘古大模型,首个落地应用“矿山AI大模型”为梅安森赋能
探访国民品牌恒安集团,好衣库明星店主深度种草
萤石网络举办2023 ECDC萤石云开发者大会 持续深拓全栈式开放云服务体系
朱民受邀出席嘉实投资策略峰会 畅谈中国经济新增长模式
希沃助力彝良数字化教学教研,着力提升乡村教师数字化素养
大华股份与中南民族大学签署战略合作协议 共推产教融合发展
CBiBank富港银行推出全流程信用证服务
海那边荣获移民及出入境服务行业2022年度“诚信专业服务示范机构”
“牛力全开 八城十店”,汇通达携手德力新能源抢滩商用车蓝海
万亿级智能洗护新赛道,每日在线旗下“兔兔洗”抢占时代新机遇
最新全球研究:半数企业高管正面临“韧性鸿沟”
健合明星产品齐聚天猫第四餐全家营养大会,共享健康新知
探拓户外助力世锦赛夺冠,与国家滑雪登山队共赴热爱!
国内最大互联网包机平台掌上包机亮相广州商务航空展
信息技术服务、商品售后服务双项认证,鲁邦通能力荣获认可
解锁新城市,Olé持续探索美好生活新灵感
毛发医疗“新业态”|国内首家毛发互联网医院“雍禾毛发健康”上线
3月28日便秘日,安翰科技携手嘉会医疗与您共同对抗便秘!
桃李面包公布2022年报:全年营业收入66.86亿元,同比增长5.54%
嘉实基金归凯:更多关注长期变量,看好四大方向
持久延时药那种效果最好?无副作用吗?听说用了thickpro加厚套直呼爽!
迪拜新地标皇家亚特兰蒂斯酒店开业 背后隐现中国制造企业
首都在线:收购怀来智慧云港100%的股权 将开展数据中心建设
寒武纪可提供能效出色的配套系统软件支撑人工智能应用
京东七鲜荣获商业地产行业“星耀奖”:携手百强地产伙伴探索模式创新