随着业务的发展,提供增强的媒体功能是未来业务发展的基本需要,特别是像电话会议业务、声讯服务类业务(语音信箱等),都要求软交换系统具有灵活控制用户交互的能力以及大容量的语音处理和存储能力。这就导致了媒体服务器的出现,并成为软交换系统中重要的功能实体之一。媒体服务器可以同时向IP和PSTN端点提供服务,也可以被看成是一类特殊的网关设备。我们的外呼系统也是基于媒体服务器开发而来。
1. 媒体服务器的资源功能
媒体服务器是软交换系统中提供专用媒体资源功能的独立设备,可以提供音频或视频信号的播放以及一些附加功能,用于融合通信网络中的增强业务。媒体服务器基本的资源功能有DTMF数字接收、信号音产生录音通知发送媒体流合成、传真等,除此之外还具有会议桥、语音识别、文语转换等专用资源。具体来说,媒体服务器需要具有如下资源功能。
(1)交互式语音应答(IVR)
交互式语音应答和语音消息传递功能是媒体服务器的关键功能,利用这些功能可以开发出像统一消息、电话银行、呼叫中心以及信用卡呼叫那样的应用。以下功能是提供IVR所必需的:
• 播放语音提示和存储语音消息;
• 录制呼入语音消息;
• 用于放音和录音功能、菜单选择、音频产生以及用户信息收集的DTMF控制。
(2)会议桥接
众多的增值业务都需要会议功能,范围包括从基本的会议召开到监视和日志应用。会议的召开要求每个与会成员都接续到一个会议桥,媒体服务器应该支持会议桥接功能,能对多方媒体流进行汇集和发送。一个通常的会议桥包括以下功能:
• 支持各种规模的会议组,每个会议组可包含3个到上百个参与者;
• 不管会议规模的大小,通过动态分析只选择少数几个音量较大的参与者声音,而滤除余下的那些声音,这样做可以避免噪声的积累,否则,如果让所有与会者发出的信号同等地进入会议桥,广播千整个会议,就会出现很大的噪声,这种要求对大型会议尤为重要;
• 通过对来自不同网络和位置的不同线路提供统一的增益控制,平衡不均匀的信号强度和噪声;
• 具有增加与会者,删除指定与会者,静音,或广播指定与会者发言的能力;
• 滤除或压制DTMF或其他音频信号,以避免这些音频信号在整个会议组里广播。但是必须保留一个能发出DTMF信号的指定与会者,以便业务(或会议主持人功能)能通过音频信号来控制会议和调停与会者的交互。
(3)传真消息
在IP环境发传真为大量节省成本和增加业务功能提供了潜力。因此,媒体服务器的一个重要需求是提供灵活的传真处理功能。媒体服务器需要支持以下的传真标准,以处理所有潜在传真消息类型。
• T.30传真,T.30定义了通过PSTN收发传真的框架结构;
• T.37传真,T.37是基于存储转发的传真标准,定义了如何像发电子邮件那样发传真;
• T.38传真,T.38标准定义了在IP网络内实时传送传真的框架,T.38标准还相当新,但已经被VoIP运营商广泛接受。
(4)DTMF音频处理
从理论上说,随着IP技术的广泛使用,本来没有必要再使用DTMF,但是在混合了分组交换和电路交换的网络中,还是需要对DTMF音频做处理。因此,媒体服务器应具有带内和带外DTMF数字检测功能。带内检测功能指媒体服务器应该能够检测语音通道内传送的DTMF信号。带外检测功能是指媒体服务器应该能根据MGCP协议或H. 248协议里的具体参数识别DTMF信号。
(5)编码转换
媒体服务器应该提供媒体格式变换功能,因为有各种不同的语音编码标准在使用,所以一些编码转换功能必须集成不同的语音编码标准,并允许呼叫无缝地穿越IP网络。编码转换也可能作为支持会议功能的一个重要需求,因为会议系统要求能够处理使用不同编码标准的混合发言。媒体服务器应该提供插件机制支持新媒体类型。
(6)文本到语音转换(TTS)
媒体服务器应具有文本至语音的转换功能,能根据命令将指定的文本信息自动转换成语音信息发送给用户。对于实时应用,媒体服务器会流化进入的媒体,通过IP网络送出去,同时侦听其中的命令。对于非实时应用,IP媒体服务器可以利用TTS把语音信息转换成一个语音文件,然后像数据一样通过网络传递。
(7)自动语音识别(ASR)
媒体服务器应具有自动语音识别功能。自动语音识别是语音驱动增值业务的关键,它使得呼叫者能使用语音命令来操控业务。媒体服务器应能够识别用户的语音命令,并根据语音命令执行相关的操作。自动语音识别的一个例子是语音打断应用。当同时放音/录音功能和语音打断功能相结合时,媒体服务器在播放一个语音提示或其他语音流的同时能够侦测到由用户发出的语音中断信号,从而提供一个很像全双工的自动电话交谈。