求职简历网 > 知识 >

语音合成系统

来源:求职简历网时间:2024-02-24 18:30:13编辑:皮带君

语音处理的定义

语音信号处理的研究起源于对发音器官的模拟。1939年美国H.杜德莱(H.Dudley)展出了一个简单的发音过程模拟系统,以后发展为声道的数字模型。利用该模型可以对语音信号进行各种频谱及参数的分析,进行通信编码或数据压缩的研究,同时也可根据分析获得的频谱特征或参数变化规律,合成语音信号,实现机器的语音合成。利用语音分析技术,还可以实现对语音的自动识别,发音人的自动辨识,如果与人工智能技术结合,还可以实现各种语句的自动识别以至语言的自动理解,从而实现人机语音交互应答系统,真正赋予计算机以听觉的功能。语言信息主要包含在语音信号的参数之中,因此准确而迅速地提取语言信号的参数是进行语音信号处理的关键。常用的语音信号参数有:共振峰幅度、频率与带宽、音调和噪音、噪音的判别等。后来又提出了线性预测系数、声道反射系数和倒谱参数等参数。这些参数仅仅反映了发音过程中的一些平均特性,而实际语言的发音变化相当迅速,需要用非平稳随机过程来描述,因此,20世纪80年代之后,研究语音信号非平稳参数分析方法迅速发展,人们提出了一整套快速的算法,还有利用优化规律实现以合成信号统计分析参数的新算法,取得了很好的效果。当语音处理向实用化发展时,人们发现许多算法的抗环境干扰能力较差。因此,在噪声环境下保持语音信号处理能力成为了一个重要课题。这促进了语音增强的研究。一些具有抗干扰性的算法相继出现。当前,语音信号处理日益同智能计算技术和智能机器人的研究紧密结合,成为智能信息技术中的一个重要分支。语音信号处理是一门多学科的综合技术。它以生理、心理、语言以及声学等基本实验为基础,以信息论、控制论、系统论的理论作指导,通过应用信号处理、统计分析、模式识别等现代技术手段,发展成为新的学科。1965年出版的《语音的分析、合成与感知(J.L.Flanagan著),1976年出版的《语音信号线性预测》(J.Q.Makoul与A.H.Gray著),以及1978年出版的《语音信号数字处理R.Rabiner和R.W.Shafer著)等教材比较全面地反映了这门学科的一些基本理论、 方法及成果。我国学者吴宗济、林茂灿主编的《实验语音学概要》,从语音产生的物理基础、生理基础、语音知觉的心理基础以及元音、辅音和声调特征等方面,给出了较详细的实验研究方法和数据。80年代后期开始对听觉器官耳蜗的研究,为研究非线性语音处理方法提供了可供借鉴的依据。高速信号处理器的迅速发展,神经网络模拟芯片的研究成功,为实现实时语音处理系统创造了物质条件,使大批语音处理技术实际应用于生产、国防等许多部门。语音信号处理在通信、国防等部门中有着广阔的应用领域。为了改善通信中语言信号的质量而研究的各种频响修正和补偿技术,为了提髙效率而研究的数据编码压缩技术,以及为了改善通信条件而研究的噪声抵消及干扰抑制技术,都与语音处理密切相关。在国防通信及指挥部门中,应用语音处理,可以实现在各种不同通信条件下的话带保密通信,计算机网络中的话音和数据综合通信,在强噪声环境(例如,髙性能战斗机,直升机环境和战场指挥所等)中使用的语音识别装置,克服强干扰影响语音降质的噪声消除装置,说话人识别与说话人证实,以及各种先进空中交通控制用的交互式语音识别/合成接口等等,都是现代指挥自动化的重要组成部分。在金融部门应用语音处理,开始利用说话人识别和语音识别实现根据用户语音自动存款、取款的业务。在仪器仪表和控制自动化生产中,利用语音合成读出测量数据和故障警告。随着语音处理技术的发展,可以预期它将在更多部门得到应用。尽管语音处理的研究已经经历了将近50年的历史,取得了许多成果,但是还面临着一系列理论和方法上的实际问题。例如在编码技术方面,中速编码已经可以提供满意的通信音质,那么低速编码是否也能突破低通信音质的局限,达到电话音质的要求?在识别方面,连续语音的分割,大词量语音的识别和识别任何人的语音等方面尚无可靠的办法。在语音理解方面,关于语义信息的定性描述和定量估计,都还没有统一的计算方法等,这些都是今后研究的重要方向。

怎么将科大讯飞interphonic5.0的语言库设置成系统语音库

科大运行库里是自带一些语音库的,但至少最基础的部分,实际效果很不好。

我总结的5.0安装步骤:

1. 安装运行库:点击 Runtime(Demo)_Chinese (PRC).msi 安装即可

2. 安装语音库:任选一个或几个语音库,如双击小倩文件夹里的setup.exe。自动安装。这里我推荐你下16K 小燕 或16K 小倩的语音库,效果最好

3. 安装工具包:点击ToolKit_Chinese (PRC).msi安装. 后期会要求绑定运行库。先以破解文件夹里的iFlyTTSGUI.exe和ttsknl.dll来替换安装文件夹
Program Files\iFly Info Tek\InterPhonic 5.0\bin 里的原有文件;然后绑定替换过的ttsknl.dll。

关于“怎么把它设置成系统的语言库呢?让其它软件或程序可以调用这个语言库?”
不用费这功夫了,我早研究过这问题,不行的


上一篇:科学计数法的定义

下一篇:没有了

相关推荐

热门头条