什么是语音合成(Speech Synthesis)？

语音合成是通过人工设备复制语音通信的过程。将文本转换为语音的计算机是一种语音合成器。手持光盘的妇女最早的语音形式合成是通过类似人类声道的机器来实现的。例如，17世纪沃尔夫冈·冯·肯佩伦发明的发声机器。通...

语音合成是通过人工设备复制语音通信的过程。将文本转换为语音的计算机是一种语音合成器。

手持光盘的妇女
最早的语音形式合成是通过类似人类声道的机器来实现的。例如，17世纪沃尔夫冈·冯·肯佩伦发明的发声机器。通过这个装置，通过厨房的风铃、风笛簧片和单簧管铃声来产生语音。厨房的风铃被设计成像肺一样工作，而声门（声带的区域）是通过风笛簧片来表现的。单簧管的铃铛充当嘴。
设备的操作是完全手动的。右手控制一系列的杠杆，左手操纵单簧管的铃铛（嘴）。还有堵住"鼻孔"以产生较少的鼻音。无论哪种方式，只要正确使用基本控制，机器就会接收气流。气流决定将产生的声音类型。
18和19世纪的后来的发声机器都保持了这种设置，尽管有一些改进。例如，在19世纪末，约瑟夫·法伯发明了一种能通过键盘和踏板接收输入的说话机器。这种机器也很有创造力，因为声音是通过人造的"脸"发出的。
20世纪初，电子技术的革新使语音合成朝着更加强大的方向发展，尽管模仿人类声道的前提仍然是一样的，但是20世纪初，由于输入更加精确，语音机器可以产生更好的声音
然而，直到计算机的出现，语音合成才真正可以在娱乐场所之外使用，这主要是因为语音合成可以存储在软件中，而不是单独的机器中。此外，在计算机的辅助下，语音合成可以呈现出不同的形式；使用人声作为声音的主要来源。
这种形式的语音合成被称为串联。这个过程通过连接各种人类语音的录音来工作。产生的声音更自然，更悦耳。这与使用发音合成的程序形成对比，通过声道的计算机模型复制语音的地方。
商用语音合成器可以采用串联或发音方法，但两者都能达到相同的目的；能够给人们一个听文本的机会。这在阅读是突兀的或不可能的情况下尤其有用。
在商业世界中，这种情况非常普遍，尤其是在电话交易中。没有文本到语音（TTS）的替代方案，企业主将不得不花钱雇佣更多的客户服务人员。综合解决方案避免了这一问题，因为一切都是由计算机完成的，而不是人。
综合语音在日常生活中也起着作用，特别是对残疾人来说。谈话时钟，字典和其他设备可以让那些看不懂或读不懂的人更容易。合成语音甚至可以给那些根本不会说话的人一个声音。著名物理学家史蒂文·霍金就是一个突出的例子。由于卢·格里格的病使他哑口无言，霍金使用语音合成器与人沟通。
还提供TTS应用程序，帮助人们进行各种计算机活动要获得这些类型的应用程序，大多数用户必须购买单独的软件或下载补丁程序。后者通常是免费的，这取决于所使用的操作系统或文字处理程序。但是，如果一个人决定购买单独的软件，他们可以使用一个更高质量的系统。具体的例子可以通过自然读者7和文本朗读2看到。
说到底，语音合成是一种技术，它彻底改变了人类的交流方式。从某种意义上说，它赋予了文本一种自己的生命。它也给了世界一个机会去聆听辉煌的思想正常情况下不会说话的人。

发表于 2020-07-10 10:37
阅读 ( 1131 )
分类：技术

什么是语音合成(Speech Synthesis)？

你可能感兴趣的文章

相关问题

0 条评论

作家榜 »

推荐文章