声网数字人表现卓越, 多场景应用推动元宇宙生态发展

两年前,中国信息通信研究院正式公布了第二批数字人产品评测结果。声网数字人凭借其在技术能力、工程化能力和安全保障三大维度的卓越表现,成功通过评测,成为国内少数获得该项权威认证的数字人厂商之一。这一认证不仅体现了声网在数字人领域的技术领先性,也为其在多个行业的深入应用提供了有力支持。

作为面向开发者推出的PaaS产品,声网数字人致力于帮助开发者快速实现虚拟人技术在社交娱乐、教育、金融、VR/AR设备、会议等场景的沉浸式体验。通过降低开发门槛,声网数字人助力开发者更高效地迈向元宇宙时代,推动虚拟与现实融合的创新应用。

元宇宙概念持续升温,并且逐渐走入大众视野,更多地为人们所熟知,用户对虚拟场景的沉浸式体验提出了更高要求。声网数字人主要提供两类场景解决方案:一类是3D沉浸式虚拟空间,适用于虚拟社交、大型虚拟演唱会、产品发布会等场景,支持万人同时在线、虚拟化身移动及实时音视频通话;另一类是虚拟人特写互动,广泛应用于直播、虚拟社交、银行客服、主题演讲等场景,支持单人或多人异地实时控制,显著提升了应用的灵活性和表现力。

在沉浸感体验方面,声网的3D空间音频技术发挥了关键作用。该技术能够根据用户Avatar的头部朝向、脸部角度、声源位置和距离动态调整音效,高度还原现实听觉环境,为用户提供更加真实的互动体验。这一技术的应用,使得虚拟场景中的交流更加自然流畅,极大地增强了用户的参与感和代入感。

当然,作为全球实时互动领域的开创者和领导者,声网虚拟人产品最核心的优势还主要体现在超低延迟的位置同步、表情和动作参数同步、音视频同步,以及高并发的稳定处理。这源于声网的RTM2.0产品,可以让实时消息做到全球范围内平均不⾼于100ms、最低达30ms传输延迟,满⾜企业元宇宙应⽤场景中对于实时性的严苛要求,给用户打造身临其境的沉浸式体验。

此外,声网提供跨平台SDK,支持开发者快速调用虚拟人形象定制功能,如捏脸、换装等,并可自主接入AI驱动模块如面部捕捉。其数字人产品还具备强大的3D渲染与原生适配能力,开发者可通过SDK接口实现界面UI定制、手势交互(拖动、缩放、旋转)及人物朝向与位置控制,大幅降低了开发复杂度。

在今年世界人工智能大会(WAIC)上,声网发布了新一代对话式AI引擎。该引擎整合了数字人交互功能,并兼容商汤等主流数字人解决方案,可搭载高度拟真、表情动作自然的数字形象,支持用户与虚拟角色进行实时、流畅的对话交互。系统提供多种数字人形象选择,适用于虚拟客服、教育陪伴、娱乐社交等多样化场景,有效增强了交互的临场感与情感连接。

行业专家指出,对话式AI正逐渐从基础问答向深度理解、情感共鸣和情境感知演进。声网对话式AI引擎通过集成声纹识别、数字人及视觉理解等先进能力,正在构建下一代自然、沉浸式人机交互的重要基础设施。

未来,随着元宇宙生态的不断成熟,声网数字人将在更多领域发挥重要作用。从虚拟社交到数字金融,从在线教育到智能客服,数字人技术的应用场景正在不断扩展。声网通过其技术领先的数字人产品和多元场景应用能力,不仅推动各行业的数字化转型,更为元宇宙生态的构建提供了坚实的技术支撑。