基于深度神经网络的语音编码技术研究任务书

 2021-09-15 13:00:05

1. 毕业设计(论文)主要内容:

语音编码是对含有语音的数字音频信号进行数据压缩的一种应用。

在生活中,高码率的音频信号数据量大,传输与存储成本都较高,为了使信号便于处理、传输和存储,就需要对语音信号进行压缩。

在保持语音高质量的前提下,占用尽可能少的通信容量,意味着能够在一定的宽带内传输更多的高质量语音,因此对语音编码技术的研究在数字语音通信中具有重要的应用价值。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 毕业设计(论文)主要任务及要求

1、 训练准备:了解语音信号基础与传统语音编码技术;准备不同说话者、不同方言等情况下的宽带语音信号作为语音编码训练库;传统编码技术需要提取复杂的声学特征,深度学习方法中只需从原始语音信号中提取语音样本作为特征参数,训练一个端对端的语音编码框架;

2、 深度神经网络训练:构建基于深度神经网络的语音编码框架,框架由两部分构成:Encoder部分学习输入语音中最优的紧凑表示,得到压缩后的编码信息,Decoder部分从编码信息中重构出高质量的宽带语音。通过压缩、重构语音信号与其它约束项,找到给定码率下最高质量的语音信号,训练初性能优越的深度神经网络是该研究最为核心的部分;

3、 语音合成:将测试用宽带语音转换到低码率下的特征参数所在域,利用深度神经网络所学习的宽带语音与压缩后语音之间的映射关系,得到给定比特率下的语音信号。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 毕业设计(论文)完成任务的计划与安排

1、 2019年1月11日-2019年1月31日:阅读深度学习、语音信号基础与传统语音编码技术相关的文献,构建语音编码实验数据集;

2、 2019年2月1日-2019年2月28日:针对性的学习编程语言、算法,理解目前现有的语音编码技术,并尝试搭建神经网络框架,完成开题报告;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 主要参考文献

[1] KankanahalliS.End-to-End Optimized Speech Coding with Deep Neural Networks[J]. In:Acoustics, Speech and Signal Processing(ICASSP), 2018 IEEE InternationalConference on. IEEE, 2018, pp. 2521-2525.

[2]Shigeo Morishima, H Harashima, and Y Katayama.Speech coding based on amulti-layer neural network. In: Communications, 1990. ICC’90, IncludingSupercomm Technical Sessions. SUPERCOMM/ICC’90. Conference Record., IEEEInternational Conference on. IEEE, 1990, pp. 429–433.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。