注册通行证 用户名 密码
  • 文章投稿
  • 博客
  • 论坛
  • 设为首页
  • 加入收藏
jztop.com网络技术
  • 首页
  • | iT新闻
  • | 操作系统
  • | 组网建网
  • | 网络安全
  • | 程序开发
  • | 办公一族
  • | 工具软件
  • | 网页制作
  • | 多媒体制作
  • | 网吧技术
  • | 服务器
  • | 专题教程
Vista | 软件评测 | 系统备份 | 优化 | 进程 | 聊天 | 病毒 | Linux | 黑客 | 防火墙 | 数据库 | Web开发 | Java | Word | 游戏 | 32位开发 | 移动开发
当前位置:首页 > 程序开发 > 微软开发专栏 > ASP.NET 内容正文:在ASP.NET程序中实现语音合成

在ASP.NET程序中实现语音合成

发布时间:2006-03-01 17:16:25 来源:天极开发 网友评论 0 条
  也许"沉默是金",但是逐渐地,各种应用程序和其它一些自动化系统都要求具有说话能力。为此,你可以把TTS技术应用于你的支持.NET的应用程序中。

  你可能已经注意到,如今语音合成越来越普遍。成百上午的电动玩具和小器具都能够以机器的声音向它们的主人讲话。不管它是一个讲话的婴儿玩偶,一个会谈话的计步器或是一新的自动的电话系统,几乎每天都在发行一种使用文本来发音的产品。

  文本-到-语音(TTS)技术,也称为语音合成,是把输入的文本转换成音频语音的过程。这种方式会优于预先录制的文本-它必须对要说的内容提前准确地了解。而使用TTS,却有可能加入动态的信息,该动态的信息可以来自于一个数据库;或者把TTS应用于一个用户说出的话被不断重复以加以肯定的情况下。

  一、 TTS试验

  如果你看到或听说过实际的TTS,那么你可能想下载一个免费版本的ReadPlease 2003。该产品能够读取Windows剪贴板中的文本。为了使用它,你只需要简单地把一些文本粘贴到ReadPlease编辑器中(见图1)-并且假定你的PC扬声器打开了,那么你会听到文本的播放。当前,该产品仅能工作在所有的Windows桌面OS版本中,但是他们还计划发行针对Mac,Unix,Palm和Windows CE操作系统的版本。

  该ReadPlease应用程序令人感兴趣的地方在于,你可以使用ReadPlease编辑器来试验你的TTS参数选择。例如,你可以通过上下移动如图1所示的Speed滑动块控件来调整发音速度。你还可以通过点击在小脸图标下方的箭头按钮来改变所用的语音。


图1.ReadPlease 2003应用程序:这个Windows应用程序可能读任何从剪贴板中粘贴到编辑字段中的文本。

  你需要什么 Visual Studio.NET 2003,微软语音应用程序SDK,1.1

  点击"Tools"菜单,然后选择"Options"允许你进一步用该TTS编辑器进行试验,例如,你可以调整在段落之间的语音引擎的暂停时间长度。升级到ReadPlease Plus版本将可以使你存取另外的一个发音编辑器选项,它让你指定怎样读一个特别的词。该ReadPlease Plus版本还包括一个你可以停靠在你的Windows桌面顶部的任务条。因此,你可以快速地从任何基于文件的应用程序拖动文本到该任务栏上并让它读给你听。

  缺省地,该ReadPlease应用程序使用内置的微软语音(Mark,Mike,Sam或Marilyn)。但是,你可以选择性地购买更高质量的AT&T Natural Voices,例如在AT&T Natural Voices Starter Pack中提供的语音。该Starter包包括8K版本的"Mike"和"Crystal",它们二者听起来都优于缺省的微软声音。

  作者注: 术语8K意味着,该抽样频率用于创建发生在每秒8000位的WAV文件。另外一种格式是16k,它可以产生一种更清晰和更为自然的听觉效果。基本上,样本率越高,声音质量好越。

  二、 微软语音应用程序SDK 1.1

  在2004年,微软发行了 Microsoft Speech Server,还有一个免费的SDK允许你开发基于Web的运行于该Speech Server上的语音应用程序。你可以使用该SDK来构建电话或只发声的应用程序-其中的计算机对用户的交互是使用一个电话来实现的。你还可以构建多模态应用程序,其中由用户选择使用语音还是传统型Web控件作为输入。

  微软TTS引擎通过把单词拆分成音素来合成文本。音素是人类语言的基本单位。它们代表一组"音",正是由它们构成单词的声音。然后由该TTS引擎分析提取的音素并且把它们转换成符号用来生成数字音频语音。

  你可以使用随同本文的可下载的示例应用程序(ExploringTextToSpeech.csproj)来试验微软TTS引擎可配置的方面。该多模态应用程序包含一个Web页面(见图2),你可以在其中输入一些文本。然后,你可以点击一个按钮来以下面方式听取文本:

  作者注:在要被播放的文本无法提前知道的情况下,使用一TTS引擎是不可避免的;然而,你可以由录制音频来得到更好的音质。当音频质量是关键的时,你可以使用微软语音应用程序软件开发工具箱(SASDK)来录制音频。例如,你可能想使用录制的音频来提示用户信息。被记录的音频可以被分解成一系列的提示,它们在运行时刻再被连接起来。

  · Speak Text Normally-提供一种测试基准

  · Say as an Acronym-文本"ASP"被发作"A.S.P."

  · Say as Name-Mr.John Doe被发作"Mister John Doe"

  · Say As Date-在这种情况中,日期格式化为:月,日,年

  · Say as Web Address-在这种情况中,文本格式化为一个统一资源标识符(URI)

  · Say as Digits-作为文本输入的数字被发作一系列的位

  · High Pitch/Slow Rate-文本以高音调慢速发出。

  · Rate Fast/Volume Loud-文本以快速高音发出。

  · Low Pitch/Volume Soft-文本以低音调适中音量发出。


图2.示例应用程序-你可以使用这个程序来听一下以多种方式说出的文本。

  该多模态应用程序使用一提示控件来指定将被播放给用户的音频。该提示控件包含一InlineContent属性-它可以包含一个或者是Content型或者是Value型的基本Speech控件。该Content控件指定一特定的包含存储的音频记录的提示文件。该Value控件指定一个HTML Web页面中的元素。该示例应用程序使用一Value控件-它参考一个名为txtText的输入元素(在图2中的"Type some text here:"域)。下面是描述了用于一个提示的标注的HTML:

<speech:prompt id="prmText" runat="server">
<InlineContent>
<speech:Value runat="server"
TargetElement="txtText"
TargetAttribute="value">
</speech:Value>
</InlineContent>
</speech:prompt>

  三、 语音合成标注语言

  该TTS引擎在怎样播放由属性InlineContent参考的文本时作出某些缺省的假设,但是开发者能通过使用语音合成标注语言(SSML)元素来控制该TTS引擎生成音频的方式。根据W3C协会的推荐,SSML是一基于XML的标注语言。表1列举出由SASDK所支持的SSML元素。

  表1.被支持的SSML元素:表中列出由SASDK所支持的SSML元素并且用于控制TTS引擎生成文本的方式。

SSML元素描述
ssml:paragraph/ssml:sentence用于把文本分解成语句或段落。
ssml:say-as用于指定播放文本的方式。它能够接受若干不同的属性来指定文本的类型。
ssml:phoneme用于控制一个单词的发音方式。
ssml:sub 用于指定一个替代单词或词组来代替指定的文本。
ssml:emphasis 用于提高放到一单词或词组中的重音。
ssml:break用于在文本的某些单词间插入一些暂停。
ssml:prosody 用于控制音调,速率和音量。
ssml:audio 用于插入被录制的音频文件。
ssml:mark 用于在文本的某个位置插入一个标记。然后可以使用这个标记来表示一事件或触发一个行为。

  该示例应用程序说明了say-as和prosodySSML元素的使用。在该Default.aspx页面上的每个按钮都相应于一个提示控件。这些提示控件在InlineContent元素中包括一ssml:say-as或一个ssml:prosody元素。下面示例显示了针对这些元素之一的HTML标注:

<speech:prompt id="prmSayAsAcronym" runat="server">
<InlineContent>
<ssml:say-as type="acronym">
<speech:Value runat="server"
TargetElement="txtText"
TargetAttribute="value"></speech:Value>
</ssml:say-as>
</InlineContent>
</speech:prompt>

  当用户点击这些按钮之一,它执行如下所示的JavaScript:

function SayAsAcronym() {
 prmSayAsAcronym.Start();
}


  在上面的示例中,名为prmSayAsAcronym的提示包括了ssml:say-as元素,它指定任何包含在txtText输入元素中的文本都应该被以每个单词的第一个字母方式发出。因此,如果你输入"ASP"到文本元素中并且点击"Say As Acronym",那么该TTS引擎将读每个字母。

  为了用该示例应用程序进行试验,你可以输入一些文本片断,然后点击每一个按钮来看一下该TTS引擎是怎样解释文本的。我主张你改变元素值并且用每一个控件生成的方式进行试验。SASDK提供给开发者关于该TTS引擎怎样生成文本的良好控件,因此试验可能会导致出现一种更为自然的基于语音的应用程序。
相关文章
  • ASP.NET2.0导航功能之配置会员和角色
  • ASP.NET编程入门随想之宽容
  • ASP.NET2.0中数据源控件之异步数据访问
  • ASP.NET2.0中使用数据源控件之参数
  • ASP.NET2.0中使用数据源控件之基础知识
【评论】【收藏本文】【打印】【关闭】
上一篇文章:.NET正则表达式使用高级技巧之替换类
下一篇文章:ASP.NET2.0导航功能之配置会员和角色
讨论区
查看
已有 0 位对此新闻感兴趣的网友发表了看法
匿名发表
注册通行证 登陆
图文阅读推荐
推荐阅讯
  • 当ASP.NET撞上JSF之模板化、式样和主题
  • ASP.NET入门随想之抽象的力量
  • 在ASP.NET应用中插入flash动画
  • ASP.NET 2.0 中的窗体身份验证
  • 业界观察:微软将在.NET上解释PHP?
  • ASP.NET2.0实现无刷新客户端回调
  • ASP.NET Atlas简单控件介绍之界面控件
  • ASP.NET 2.0编程小技巧两则
  • ASP.NET 2.0服务器控件开发之简单属性
  • .NET设计模式研究之装饰模式
阅读排行
  • 1.用ASP.NET 2.0设计网络在线投票系统
  • 2.在ASP.Net 2.0中实现多语言界面的方法
  • 3.轻松加密ASP.NET 2.0 Web程序配置信息
  • 4.在ASP.NET中使用AJAX的简单方法
  • 5..NET 2.0中的企业库异常处理块简述
  • 6.面向.NET开发人员的Ajax 技术平台策略
  • 7.揭开ASP.NET中Cookie编程的奥秘
  • 8.ASP.NET2.0服务器控件之创建自定义控件
  • 9.ASP.NET2.0中Gridview中数据操作技巧
  • 10.ASP.NET 2.0发送电子邮件全面剖析之二
专题教程
  • 大话G游 专题:手机病毒揭密
  • ARP攻击防范与解决方案 路由故障处理手册
  • Picasa中文版_Picasa教程 专题:清除流氓软件
  • Firefox专题 seo搜索引擎优化专区
  • 重装Windows必知的事情 装机之必备软件大行动
病毒专杀栏
  • 杀毒软件反被病毒杀 连"救命"都不能喊
  • 金山ARP防火墙
  • 还原卡神话破灭“机器狗”病毒来势汹汹
  • cctv经济半小时:你的手机现在安全吗?
  • 新挂马方式开始流行 ARP挂马称雄局域网
  • 木马和病毒清除的通用解法
  • IP地址不再冲突 查找ARP攻击者元凶
  • 教你几招识别和防御Web网页木马
  • 分析:封杀BT只是暂时的止痛药
  • QQ爆危险漏洞,“QQ游戏邀请大盗”邀请你玩病
关于我们 | 诚聘英才 | 联系我们 | 版权声明 | 网站大事 | 网站地图 | 意见建议
CopyRight 2005-2007 Jztop.Com 版权所有 未经许可 请勿转载