语音可扩展标记语言
语音可扩展标记语言(英语:Voice Extensible Markup Language,简称VoiceXML 或 VXML)是于交互式语音回应应用程序建立音频对话的标准,用于开发音频及声音回应应用程序,例如银行系统及自动客户服务。来自网页服务器的超文本标记语言(HTML)被网页浏览器接收后,网页浏览器能对其进行解析并视觉呈现出来,VoiceXML应用程序的开发及部署也类似这方式。VoiceXML文档由语音浏览器解析。于一般的部署架构之下,用户通常经由公共交换电话网(PSTN)跟语音浏览器交互。VoiceXML文档以XML为基础,是由万维网联盟(W3C)开发的标准。
用法
编辑VoiceXML应用程序于各行业及商业领域广泛使用,包括订单查询、包裹追踪、驾驶方向、紧急通知、唤醒、航班跟踪、语音访问电子邮件、客户关系管理、还按原方抓药、音频新闻杂志、语音拨号、房地产信息和国家目录援助等。 VoiceXML的标签能指示语音浏览器提供语音合成、自动语音识别、对话管理和音频播放。下面是一个VoiceXML文档的例子:
<vxml version="2.0" xmlns="http://www.w3.org/2001/vxml">
<form>
<block>
<prompt>
Hello world!
</prompt>
</block>
</form>
</vxml>
当一个VoiceXML解析器解析该文档时,“Hello world”字句将以语音合成方式读出。
通常情况下,HTTP被用作获取VoiceXML页面的发送协议。一些应用程序可能使用静态的VoiceXML页面,而依靠动态的VoiceXML作页面生成的应用程序则需使用应用程序服务器,例如Tomcat、WebLogic、IIS或WebSphere。
从历史上看,VoiceXML的平台供应商以各种不同方式执行其标准,并添加专有产品特点。但是,VoiceXML 2.0标准于2004年3月16日被采纳为W3C推荐标准,阐明了大部分的差异之处。VoiceXML论坛为推广标准用途的产业群,它提供了一个一致性测试过程,以证明供应商的执行方式的一致性。
历史
编辑为了开发一个用于语音对话的标准标记语言,美国电话电报公司、IBM、朗讯科技及摩托罗拉于1999年3月构成了VoiceXML论坛。同年9月,他们于论坛开放会员留言功能,并于2000年3月发布了VoiceXML 1.0。不久后,他们把标准的控制权移交至W3C。[1]其后W3C生产了数个中间版本,并于2004年3月生产了最终推荐阶段的VoiceXML 2.0。[2]
基于VoiceXML 2.0的反馈,VoiceXML 2.1 (页面存档备份,存于互联网档案馆)的新增功能相对较少。VoiceXML 2.1能向下兼容VoiceXML 2.0,并于2007年6月达致W3C推荐阶段。[3]
将来发展
编辑VoiceXML 3.0 (页面存档备份,存于互联网档案馆)将会是VoiceXML的下一个主要发行版,包含新的主要特点。它包含一个新的XML状态图描述语言,名为SCXML。
参考文献
编辑- ^ Introduction. VoiceXML Forum. 2007-11-04 [2015-04-24]. (原始内容存档于2015-07-04) (英语).
|year=
与|date=
不匹配 (帮助) - ^ W3C recommends VoiceXML 2.0. InfoWorld, Ephraim Schwartz. 2004-03-17 [2015-04-24]. (原始内容存档于2017-06-27) (英语).
- ^ Voice Extensible Markup Language (VoiceXML) 2.1. World Wide Web Consortium (W3C). [2015-04-24]. (原始内容存档于2021-05-07) (英语).
外部链接
编辑- (英文)W3C语音浏览器工作组 (页面存档备份,存于互联网档案馆),官方VoiceXML标准
- (英文)VoiceXML论坛 (页面存档备份,存于互联网档案馆),VoiceXML商标持有人
- (英文)DMOZ 开放式目录列表——VoiceXML (页面存档备份,存于互联网档案馆)
- (英文)VoiceXML教程
参见
编辑- ECMAScript,VoiceXML的脚本语言
- OpenVXI,一个开源的VoiceXML解析器
- SCXML