语音合成是通过人工设备复制语音通信的过程。将文本转换为语音的计算机是一种语音合成器。 手持光盘的妇女 最早的语音形式合成是通过类似人类声道的机器来实现的。例如,17世纪沃尔夫冈·冯·肯佩伦发明的发声机器。通...
语音合成是通过人工设备复制语音通信的过程。将文本转换为语音的计算机是一种语音合成器。

手持光盘的妇女
最早的语音形式合成是通过类似人类声道的机器来实现的。例如,17世纪沃尔夫冈·冯·肯佩伦发明的发声机器。通过这个装置,通过厨房的风铃、风笛簧片和单簧管铃声来产生语音。厨房的风铃被设计成像肺一样工作,而声门(声带的区域)是通过风笛簧片来表现的。单簧管的铃铛充当嘴。
设备的操作是完全手动的。右手控制一系列的杠杆,左手操纵单簧管的铃铛(嘴)。还有堵住"鼻孔"以产生较少的鼻音。无论哪种方式,只要正确使用基本控制,机器就会接收气流。气流决定将产生的声音类型。
18和19世纪的后来的发声机器都保持了这种设置,尽管有一些改进。例如,在19世纪末,约瑟夫·法伯发明了一种能通过键盘和踏板接收输入的说话机器。这种机器也很有创造力,因为声音是通过人造的"脸"发出的。
20世纪初,电子技术的革新使语音合成朝着更加强大的方向发展,尽管模仿人类声道的前提仍然是一样的,但是20世纪初,由于输入更加精确,语音机器可以产生更好的声音
然而,直到计算机的出现,语音合成才真正可以在娱乐场所之外使用,这主要是因为语音合成可以存储在软件中,而不是单独的机器中。此外,在计算机的辅助下,语音合成可以呈现出不同的形式;使用人声作为声音的主要来源。
这种形式的语音合成被称为串联。这个过程通过连接各种人类语音的录音来工作。产生的声音更自然,更悦耳。这与使用发音合成的程序形成对比,通过声道的计算机模型复制语音的地方。
商用语音合成器可以采用串联或发音方法,但两者都能达到相同的目的;能够给人们一个听文本的机会。这在阅读是突兀的或不可能的情况下尤其有用。
在商业世界中,这种情况非常普遍,尤其是在电话交易中。没有文本到语音(TTS)的替代方案,企业主将不得不花钱雇佣更多的客户服务人员。综合解决方案避免了这一问题,因为一切都是由计算机完成的,而不是人。
综合语音在日常生活中也起着作用,特别是对残疾人来说。谈话时钟,字典和其他设备可以让那些看不懂或读不懂的人更容易。合成语音甚至可以给那些根本不会说话的人一个声音。著名物理学家史蒂文·霍金就是一个突出的例子。由于卢·格里格的病使他哑口无言,霍金使用语音合成器与人沟通。
还提供TTS应用程序,帮助人们进行各种计算机活动要获得这些类型的应用程序,大多数用户必须购买单独的软件或下载补丁程序。后者通常是免费的,这取决于所使用的操作系统或文字处理程序。但是,如果一个人决定购买单独的软件,他们可以使用一个更高质量的系统。具体的例子可以通过自然读者7和文本朗读2看到。
说到底,语音合成是一种技术,它彻底改变了人类的交流方式。从某种意义上说,它赋予了文本一种自己的生命。它也给了世界一个机会去聆听辉煌的思想正常情况下不会说话的人。