首页 > 综合

声网数字人表现卓越, 多场景应用推动元宇宙生态发展

两年前，中国信息通信研究院正式公布了第二批数字人产品评测结果。声网数字人凭借其在技术能力、工程化能力和安全保障三大维度的卓越表现，成功通过评测，成为国内少数获得该项权威认证的数字人厂商之一。这一认证不仅体现了声网在数字人领域的技术领先性，也为其在多个行业的深入应用提供了有力支持。

作为面向开发者推出的PaaS产品，声网数字人致力于帮助开发者快速实现虚拟人技术在社交娱乐、教育、金融、VR/AR设备、会议等场景的沉浸式体验。通过降低开发门槛，声网数字人助力开发者更高效地迈向元宇宙时代，推动虚拟与现实融合的创新应用。

元宇宙概念持续升温，并且逐渐走入大众视野，更多地为人们所熟知，用户对虚拟场景的沉浸式体验提出了更高要求。声网数字人主要提供两类场景解决方案：一类是3D沉浸式虚拟空间，适用于虚拟社交、大型虚拟演唱会、产品发布会等场景，支持万人同时在线、虚拟化身移动及实时音视频通话；另一类是虚拟人特写互动，广泛应用于直播、虚拟社交、银行客服、主题演讲等场景，支持单人或多人异地实时控制，显著提升了应用的灵活性和表现力。

在沉浸感体验方面，声网的3D空间音频技术发挥了关键作用。该技术能够根据用户Avatar的头部朝向、脸部角度、声源位置和距离动态调整音效，高度还原现实听觉环境，为用户提供更加真实的互动体验。这一技术的应用，使得虚拟场景中的交流更加自然流畅，极大地增强了用户的参与感和代入感。

当然，作为全球实时互动领域的开创者和领导者，声网虚拟人产品最核心的优势还主要体现在超低延迟的位置同步、表情和动作参数同步、音视频同步，以及高并发的稳定处理。这源于声网的RTM2.0产品，可以让实时消息做到全球范围内平均不⾼于100ms、最低达30ms传输延迟，满⾜企业元宇宙应⽤场景中对于实时性的严苛要求，给用户打造身临其境的沉浸式体验。

此外，声网提供跨平台SDK，支持开发者快速调用虚拟人形象定制功能，如捏脸、换装等，并可自主接入AI驱动模块如面部捕捉。其数字人产品还具备强大的3D渲染与原生适配能力，开发者可通过SDK接口实现界面UI定制、手势交互（拖动、缩放、旋转）及人物朝向与位置控制，大幅降低了开发复杂度。

在今年世界人工智能大会（WAIC）上，声网发布了新一代对话式AI引擎。该引擎整合了数字人交互功能，并兼容商汤等主流数字人解决方案，可搭载高度拟真、表情动作自然的数字形象，支持用户与虚拟角色进行实时、流畅的对话交互。系统提供多种数字人形象选择，适用于虚拟客服、教育陪伴、娱乐社交等多样化场景，有效增强了交互的临场感与情感连接。

行业专家指出，对话式AI正逐渐从基础问答向深度理解、情感共鸣和情境感知演进。声网对话式AI引擎通过集成声纹识别、数字人及视觉理解等先进能力，正在构建下一代自然、沉浸式人机交互的重要基础设施。

未来，随着元宇宙生态的不断成熟，声网数字人将在更多领域发挥重要作用。从虚拟社交到数字金融，从在线教育到智能客服，数字人技术的应用场景正在不断扩展。声网通过其技术领先的数字人产品和多元场景应用能力，不仅推动各行业的数字化转型，更为元宇宙生态的构建提供了坚实的技术支撑。