全文总字数:1512字
1. 毕业设计(论文)主要内容:
本论文题目参考学术论文成果。语音合成在人机交互中具有重要的地位,基于文本能够直接生成音频数据是语音合成的目标。本论文使用序列到序列模型实现由文本生成梅尔频谱图,随后使用声码器,实现从梅尔频谱图生成音频。
本论文的主要研究内容包括:
(1)综合Tacotron2以及Transformer模型两者的优点,得到Transformer TTS模型,实现由文本生成梅尔频谱图;
2. 毕业设计(论文)主要任务及要求
1.查阅15篇相关文献(不少于3篇外文文献),并每篇书写200—300字文献摘要(装订成册,带封面);
2.认真填写周记,完成至少1500字开题报告(“设计的目的及意义”至少800汉字;“基本内容和技术方案”至少400汉字;进度安排应尽可能详细);
3.完成5000中文字以上的相关英文专业文献翻译,并装订成册(中英文一起,带封面);
3. 毕业设计(论文)完成任务的计划与安排
(1)2020/1/13—2020/2/28:确定选题,查阅文献,外文翻译和撰写开题报告;
(2)2020/3/1—2020/4/30:系统架构、程序设计与开发、系统测试与完善;
(3)2020/5/1—2020/5/25:撰写及修改毕业论文;
4. 主要参考文献
[1]Shen J, Pang R, Weiss R J, et al. Natural tts synthesis byconditioning wavenet on mel spectrogram predictions[C]//2018 IEEE InternationalConference on Acoustics, Speech and Signal Processing (ICASSP). IEEE, 2018:4779-4783.
[2]VASWANI A, SHAZEER N, PARMAR N, et al. Attention is all youneed[C]//31st Annual Conference on Neural Information Processing Systems. NIPS,2017: 5998-6008.
[3]Li N , Liu S , Liu Y , et al. Neural Speech Synthesis withTransformer Network[J]. 2018.
以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。