新闻资讯-舞蹈芭蕾

“AI孙悟空”亮相大阪世博会,中国科技实力闪耀全球舞台

在2025年大阪·关西世博会上,中国馆凭借其宏大的规模和丰富的展览内容,吸引了全球的目光。作为本届世博会面积最大的外国自建馆之一,中国馆不仅展示了“嫦娥五号”和“嫦娥六号”带回的月壤样本,以及“蛟龙”号深潜器的体验舱,更在AI领域带来了令人瞩目的创新——由科大讯飞联合打造的“AI孙悟空”。

这一创意源自中国第一部彩色动画长片《大闹天宫》中的经典角色孙悟空,他是无数中国人心中的动画英雄。在讯飞星火大模型的赋能下,“AI孙悟空”以中日英三国语言与观众进行实时互动,不仅传播了中国文化,还成为了中国馆的“导览小能手”。他能够图文并茂地介绍中国地道的美食和意境深远的古诗词,让观众在轻松愉快的氛围中领略中国文化的魅力。

“AI孙悟空”的亮相,无疑成为了中国馆的一大亮点。他身着虎皮裙,手持金箍棒,形象生动逼真。依托讯飞星火的技术,他能够自如地切换三国语言,回答观众的问题,且回答风格完全符合孙悟空的角色特点。即使在嘈杂的环境中,他也能精准捕捉到观众的声音,并迅速给出准确的回答。

除了语言交流,“AI孙悟空”还展示了他的多才多艺。他能够根据观众的请求,“写诗作画”,将古诗词中的景象用画笔描绘出来。这一功能不仅让观众领略了AI技术的神奇,也让他们更加深入地感受到了中国文化的魅力。

“AI孙悟空”的成功打造,离不开科大讯飞团队在数字人和星火大模型问答能力上的深厚积累。他们结合上影元为孙悟空构建的3D模型,进行了大量的AI化工作,让孙悟空在动起来的同时,还能结合大模型能力回复观众的问题,与人进行交互。这种结合不仅让孙悟空的形象更加生动逼真,也让观众在互动中感受到了AI技术的魅力。

科大讯飞在语音识别领域的技术突破,为“AI孙悟空”的成功打造提供了有力支持。他们突破了“鸡尾酒会”难题,实现了在多人对话的场景中精准识别出多位主讲人的声音。这一技术不仅让“AI孙悟空”在嘈杂的环境中也能准确捕捉到观众的声音,还为他提供了强大的语音识别能力。

科大讯飞的多情感超拟人语音合成技术也高度还原了孙悟空的声线。他们通过语音大模型音色解耦技术,控制合成语音的音色,完美复刻了86年版《西游记》中孙悟空的配音演员李世宏老师的声音。这一技术不仅让“AI孙悟空”的声音更加逼真,也让他能够用同样的音色说出日语和英语,实现了孙悟空的声音穿越时空与观众对话。

“AI孙悟空”的多模态交互能力也是他成功打造的关键因素之一。他能够依据和游客语音对话的内容生成丰富的动作和表情,让每一个动作、每一个神态都与语言表达完美契合。同时,他还能依托讯飞星火大模型的视觉处理图像理解与创作能力,基于语义需求生成高质量视觉内容,从而打造出这个能“写诗作画”的AI孙悟空。

科大讯飞在AI领域的深厚积累和技术突破,不仅让“AI孙悟空”成为了本届世博会上的一大亮点,也展示了中国科技实力的生动注脚。这一创新不仅让观众领略了AI技术的神奇和魅力,也为中国科技在国际舞台上赢得了更多的关注和赞誉。

标签: 舞台 科技 孙悟空 世博会 李世宏