APP下载

面向5G Advanced网络的话音业务演进研究

2022-02-14吴滨张剑寅周越魏彬

移动通信 2022年1期
关键词:话音算力音视频

吴滨,张剑寅,周越,魏彬

(中国移动通信研究院,北京 100053)

0 引言

以GSM(Global System for Mobile Communications)为代表的2G移动通信技术经过20年的发展和普及,使全球移动话音通信业务获得了空前的成功。到了4G LTE时代,伴随网络速率的大幅提高,话音实现了高清音质传输,并在音频通话的基础上开始拓展视频通话业务市场,同时,以多媒体彩铃为代表的各种话音增值业务也推动了用户业务和体验的不断升级。

5G时代话音业务仍然是运营商的核心业务,5G网络[1]商用为语音业务和体验进一步升级带来了新的契机。3GPP已明确5G网络仍基于IMS(IP Multimedia System)提供话音业务。4G VoLTE(Voice over LTE)及5G VoNR(Voice over New Radio)作为IMS话音业务的不同接入方式存在,VoNR下强制支持EVS(Enhanced Voice Services)编解码,可有效提升语音通话音质到高保真级别,视频业务质量也将有更大提升。与此同时,网络技术也在进一步演进,3GPP在2021年4月举行的会议上确定以5GA(5G Advanced)作为5G网络演进的新阶段[2],5G及5GA网络带宽的进一步提升,使得运营商有更为充分的资源提升话音业务用户体验,面向5GA,用户话音业务的诉求不再局限于音视频,新型数据通道的引入使得用户针对同一事务共同协作和互动成为可能。预计到2025年,5GA架构下话音业务将进一步向交互式及沉浸式通信方向演进。

1 话音网络演进的技术路线

1.1 从CS话音到IMS话音

移动通信网络以十年一代的节奏演进,网络经历了从2G到3G、4G、5G的演进,与移动网络技术演进相匹配,无线侧体现为从GSM向UMTS、LTE等发展,核心网侧则体现为PS(Packet Switch)域、EPC(Evolved Packet Core)的出现和演进,在这个过程中,话音业务经历了从TDM(Time-Division Multiplexing)到IP、从传统交换机到软交换的发展,4G网络开始,LTE技术[3]的逐渐成熟使移动网络端到端VoIP业务商用部署成为可能,VoLTE基于IMS[4-5]的全IP架构实现了基于分组域的语音和多媒体业务的迅速发展,用户在LTE网络上的话音业务可拥有优于传统CS话音的业务体验。IMS采用SIP协议[6-7]作为不同分组接入网络的统一会话控制协议,从而成为业界公认的下一代的语音/多媒体业务控制和网络融合的架构。VoLTE的实施标志着移动网络向全IP网络迈出了重要的一步,传统CS域也将逐步退出历史舞台,话音网络也将成为真正的VoIP网络。

1.2 IMS话音:从VoLTE到VoNR,继续演进至VoNR+

VoLTE是4G网络下的话音方案,通过IMS实现将语音业务承载在IP网络,将2G/3G电路域所有业务在4G网络全部IP化。4G网络建成后,出于对网络发展的不同阶段及对语音业务连续性的考虑,4G还提出了电路域回落(CSFB,Circuit Switched Fallback)过渡方案。与此类似,在5G网络下,话音业务目前也有两种方案,一个是VoNR,另一个就是EPS Fallback。VoNR方案下可实现语音业务和数据业务并发,所有业务都通过5G网络承载,语音业务使用IMS进行控制。EPS Fallback方案用于终端在5G网络不支持语音业务的场景,通过重定向或切换的方式回落到4G网络,由VoLTE来提供语音业务,语音通话结束后再返回到5G网络。可以看出,VoNR在语音和数据业务体验上优于EPS Fallback,且利于加速2G电路域语音退网,重耕2G/3G优质频段。

随着5G网络逐步实现连续覆盖及5G VoNR标准的逐步成熟,基于5G VoNR超高清多媒体通信能力的全媒体增值服务——VoNR+将进一步提升4G及5G话音业务体验,丰富业务内涵[9]。伴随着网络从4G、5G到5GA的演进,话音业务也将逐步实现VoLTE、VoNR到VoNR+的演进(图1)。VoNR+是指在5G VoNR多媒体实时通信的基础上搭载新的数据传输通道,为用户提供除高清音视频之外更丰富的实时交互服务,并建立以多媒体实时通信能力平台为中心、统一开放的网络架构,在兼容现有业务的基础上实现创新业务的敏捷开发和快速部署。

图1 话音业务演进路线:从VoLTE到VoNR,继续演进到VoNR+

2 5G Advanced网络话音技术:VoNR+

5G VoNR+秉承不同于现有话音业务及架构的新理念,VoNR+将运营商的封闭话音网络发展成为一个可管、可控、易用的服务网络,在传统话音听说体验的基础上,为用户提供高清、可视、实时交互通信服务,通过算网融合及端云协同技术,对高清音视频及数据进行实时渲染,为用户提供沉浸式通信体验。

2.1 业务需求分析

(1)交互式通信需求

1)2C市场交互式通信:移动终端智能化和大屏化使得用户实时通信的诉求不再局限于通话双方声音和影像的交流。触、摸、拖、拽等操作的互动,通话双方共同协作,交互操作需求让话音业务有了新的生命和活力。一个典型的应用场景是交互式菜单,用户在通话过程中可以在手机屏幕上接收云端推送的可触摸客服菜单,并通过点击菜单按钮进入相应的子级菜单获取信息。交互式菜单业务使客服菜单内容一目了然,用户不必担心记错或点错菜单编号,大幅简化了消费者与客服的服务交互,提升交互效率和用户体验。

2)2B垂直行业交互式通信:通过引入实时交互通道,面向垂直行业在高清实时多媒体通话过程中可按需增加行业特色交互式应用。一个典型应用场景是远程医疗,医生可以远程控制戴在护士手上的触觉手套对救护车里的病人进行超声诊断,获取超声图像,第一时间做出诊断决策。

(2)增强现实及沉浸式通信需求

XR(Extended Reality)技术[10]的不断发展和产业成熟将催生沉浸式音视频业务体验。在AR(Augmented Reality)游戏、VR(Virtual Reality)视频直播点播、360度视频直播点播等应用后,AR已经率先在2C/2B领域开始了商用。典型应用场景包括AR社交、AR远程购物及AR远程维修。采用VoNR+技术可以将音视频信息与包含用户FOV(Field of View)等信息同步传递及渲染,在网络侧实现AR渲染功能,从而大大简化现有AR终端的设计。

1)AR社交:在高清视频通话的基础上,通过叠加表情包、虚拟形象、任务道具等AR互动增加通话和交互的趣味性,满足年轻人追求时尚、彰显自我的需求。

2)AR远程购物:通过AR视频通话,为实际购买者提供远程购物协助。双方开启视频通话,现场的实物影像可以通过高清视频传送给实际购买者,购买者可以在手机屏幕上对自己想要购买的物品做出标记。标记好的画面会传送到购物现场,当现场的镜头发生移动时,购买者做出的标记会始终绑定被标记物。现场的亲友可以一边进行语音交流,一边根据实物上的标记选择正确的待购物品。

3)AR维修:高清视频通话与AR、AI[11]等技术结合可远程解决一些简单的故障,或者提前识别潜在的故障原因,避免上门或减少上门次数,可大幅提升维修效率。AR维修适用于家庭宽带、汽车、车间等应用场景,比如,家中的电器坏了,可以立即与专业维修人员进行视频通话,并在视频画面上用指示箭头或激光笔标识出故障点或相关关键信息,让远端的维修人员帮助进行远程诊断。

(3)万物互联需求

5GA时代,音视频连接将延伸到超过200亿的人与人和人与物的连接。在5G应用场景中,诸如超高清视频、AR/VR通信和IoT等场景需要构筑在话音通信能力上,这意味着话音会从消费者话音业务转变为增强的实时通信网络能力,并将在专网和互联网中运行,终端也将从手机变成为诸如电视、手表、车,甚至是机器人,通过在用户通话过程中同步传递通信双方体感设备或周边设备的数据信息,将大大增强消费者话音业务的使用体验,为运营商创造商业价值。

可以看出,VoNR+结合多媒体、AI、XR等能力重塑通话入口,本质上是打造了一个基于全新的原生通话入口。用户无需下载安装APP和注册,即可享受多媒体、全交互、可信的全新通话体验。新的业务体验也将推动VoNR+催生更为灵活的、可定制化的商业模式。

2.2 关键技术

(1)数据通道技术

3GPP目前已完成5G网络IMS DC(Data Channel,数据通道)实时交互通道相关技术标准,于2020年3月写入并发布了TS 26.114 V16.5.0版本[12]。IMS DC技术为运营商原生通话带来了全新的想象空间。VoNR+可借助数据通道技术,在原来打电话的语音通道、视频通道之外,再建立一条数据通道。网络侧针对音视频通道业务进行分层编码和分层传输,并提供不同的5QI(5G QoS Identifier)进行QoS保障;针对数据通道业务,识别不同的数据包并以更细粒度实施QoS控制,引入新的QoS参数以支持触觉数据或传感器数据传输。数据通道可伴随通话传递位置、图片、文字叠加AR,甚至是听觉、视觉、触觉、动觉、环境信息等更丰富的交互信息,将通话从单一话音升级为多媒体(如图2所示),从双向视听升级到多维交互,从视听通信升级到全感通信,为用户提供同步的全沉浸式体验,带来基础话音业务的颠覆性升级。

图2 数据通道技术

(2)算网融合技术

VoNR+业务将承载更为丰富的媒体流,其中涉及对音视频流处理、数据通道媒体与音视频媒体的混流渲染等需要大量算力的应用场景,而算力与网络在形态和协议方面是需要深度整合的。VoNR+为了同步支持音视频及数据通道媒体的渲染和计算,需要统一部署、就近调度,建立VoNR+算网一体化基础设施,实现媒体算力和IMS网络由网随算动、算网融合走向算网一体,打破IMS网络和算力基础设施的边界,实现算网一体内生[13]。IMS网络需要根据业务需求,按需进行算力编排,灵活调度泛在算力资源,协同网络算力和资源,实现IMS算力路由,通过灵活部署的在网计算对IMS多媒体流进行就近加速处理,降低应用响应时延,提升系统处理效率。

VoNR+中的媒体计算处理业务包括实时话音翻译及AR远程标注等对音视频进行处理的业务,网络侧算力资源需要对话音媒体进行分布式处理,通过将媒体算力节点与IMS数据面核心网元SBC(Session Border Controller)进行融合实现媒体面的算网一体(如图3),需要IMS网络实现算力资源调度及实时处理,基于IMS的算力网络将是未来VoNR+业务体验保证的重要技术。

图3 媒体面算网融合技术

(3)终端关键技术

为满足用户VoNR+业务需求,3GPP定义了终端DC技术要求(如图4),终端需升级音视频通信协议栈来支持IMS DC通道的建立和协商,支持根据交互式业务的可靠性要求,协商业务带宽、时延及丢包率等QoS指标,通过内置原生系统服务实现叠加于音视频之上的数据通道的连接和管理[14]。基于Web技术及JavaScript脚本可以实现应用及网络自定义的灵活界面显示,减少对端侧繁琐的定制诉求;同时,终端应支持将IMS DC向应用层开放调用接口,使能IMS DC作为新的行业应用入口,壮大基于运营商音视频的行业应用生态。

图4 3GPP定义的DCMTSI终端功能

(4)端云协同技术

VoNR+需要支持多媒体通信数据流的协同,比如,触感通信需要多维数据采集,以实现多业务流间的传输协同和统一调度,保障数据包同步到达处理服务器及终端,因此端云协同将是VoNR+业务体验的重要保证技术。借助端、边、云的协同,VoNR+将运营商的封闭话音网络发展成为一个可管、可控、易用的服务网络,将云端能力通过边缘云传递给终端(如图5),使得VoNR+具备了业务快速创新、快速部署和快速上线的能力,并且避免了终端频繁升级,使得持续地业务创新和体验升级成为可能。

图5 VoNR+端云协同架构

2.3 标准及产业进展

(1)3GPP(3rd Generation Partnership Project)

VoNR+相关标准工作主要在SA1、SA2、及CT开展。3GPP在R16已完成5G网络的IMS DC实时交互通道相关技术标准,于2020年3月写入并发布了TS 26.114 V16.5.0版本,实现了5G VoNR业务能力的增强。在CT1,R17项目FS_eIMS5G2研究了IMS如何更好地使用5GC能力,特别是利用5GC的MEC(Mobile Edge Computing)能力实现信令媒体面优化。在SA1,R18项目FS_MMTELin5G中定义了可视菜单、屏幕共享、AR通信及第三方ID接入等场景和需求,并发布了TR 22.873,完成了TS 22.261的修订。在R18中将重启IMS切片、服务化等研究内容,将纳入SA1新通话需求。3GPP SA2中NG.RTC立项申请也已获得通过。

(2)GSMA(Global System Mobile Association)

2021年1月,NG 5GJA启动virtual task force,制定VoNR+数据通道白皮书,纳入数据通道典型应用场景、构建产业和生态,目前已完成发布版本。2021年2月IP COMMS启动Future of Voice Calling讨论,探讨话音业务的未来发展方向。2021年3月IP COMMS启动Business Voice Calling讨论,探讨面向2B的话音发展方向。

(3)ITU(International Telecommunications Union)

2021年7月,中国移动在ITU-T SG11组主导完成“基于DC(Data Channel)的IMS增强信令架构”立项,该立项旨在加强基于DC的VoNR+架构领域的标准制定,并为3GPP、GSMA等其他标准组织提供更多有益的反馈及输入。

(4)CCSA(China Communications Standards Association)

2020年11月,CCSA在TC3WG4组启动5G增强实时通信业务研究,面向通信网络和媒体技术的持续演进及人们多元化的通信需求等提出潜在的、高价值的VoNR+业务场景,包括传统业务、企业通信、新型业务、特殊群体和安全通信等,探讨网络架构和安全隐私等关键诉求,支撑下一代通信网络技术研究。在TC3WG1工作组开展下一代实时通信网络研究技术,从传统业务的演进和体验增强、新型业务的构想和需求识别等方面,基于现有IMS系统研究构建下一代通信网络架构,同时在TC11WG3工组组也启动了终端支持VoNR+业务的技术研究。

(5)5GDNA(5G Deterministic Networking Alliance)

运营商联合产业各方已经开始了多层次、多维度的新型商业模式探索,共同打造VoNR+产业生态,实现开放、合作和共赢。2021年8月,中国移动在5GDNA联盟中联合多家伙伴成立业界首个VoNR+工作工作组,该工作组由芯片、模组、终端、网络、应用等十余个行业伙伴组成,主要从技术路线、商业模式、终端推进三大方向形成产业共识,推进VoNR+生态建设。

3 结束语

话音业务演进与移动通信网络发展是相辅相成的,随着5G大规模商用及VoNR的进一步普及,预计2025年话音业务将演进到VoNR+。VoNR+是基础通信迈向未来全息沉浸式交互通信[15]的核心突破口,后续将通过引入算力网络等技术,不断将VoNR+的触角延伸到沉浸式、低延迟和拟真模式,让用户具有身临其境的感官体验,并将作为未来元宇宙(Metaverse)的基础使能业务能力,通过全感通信,推动现实世界社交关系链在数字世界发生转移和重组,最终将实现基础通信业务的颠覆式突破,形成一个安全、稳定、有序的现实世界的元宇宙空间。

猜你喜欢

话音算力音视频
基于网络5.0的重叠网形态算力网络
卫星通信在算力网络中的应用研究
中国电信董事长柯瑞文:算力成为数字经济的主要生产力
基于SiteAI算力终端的交通态势感知系统
3KB深圳市一禾音视频科技有限公司
WIFI音视频信号传输的关键问题探究
话音叠加中实时混音算法的FPGA实现
高速公路整合移动音视频系统应用
IP语音报头压缩设计与实现
Roland专业音视频新技术研讨会在上海召开