基于文本相关的声纹识别研究任务书

 2021-12-16 22:10:42

全文总字数:2828字

1. 毕业设计(论文)主要内容:

声纹识别是一种生物识别技术,它利用人类语音的独特特征对身份进行识别。

作为第三大生物特征识别技术,声纹识别开始进入人们的生活。

目前声纹识别技术已经在部分银行投入使用,用户登录手机银行APP,进行转账、支付等交易。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 毕业设计(论文)主要任务及要求

  1. 完成深度学习络结构搭建使python语或matlab完成声纹识别的代码编写,可以使现有机器学习类库(Pytorch\Tensorflow\Matlab\Kaldi)进编写。

  2. 查询文本相关声纹识别的相关国内外文献,声纹识别技术包括前端的语音处理部分和后端的网络结构,前端主要是语音特征提取,提取用于辨别说话人的特征,后端核心为训练说话人识别模型。

    整个研究包括信号处理、声学研究和深度学习算法、框架。

    剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

    3. 毕业设计(论文)完成任务的计划与安排

    1. 2020年1月11日-2020年1月31日 查看相关国内外文献 。

    2. 2020年2月1日-2020年2月28日 针对性的学习Python编程语言;完成Tensorflow、MATLAB或kaldi框架搭建;熟悉声纹识别流程;尝试实现已阅读文献中的方法;完成开题报告。

    3. 2020年3月1日-2020年3月31日 处理原始数据集,数据集分为训练集、测试集和验证集,提取声纹特征(特征工程)。

    剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

    4. 主要参考文献

    1. ChaoLi et al. “Deep Speaker: an End-to-End Neural Speaker Embedding System”. In: arXiv e-prints,arXiv:1705.02304 (2017), arXiv:1705.02304.
    2. Xingang Pan et al. “Two at Once:Enhancing Learning and Generalization Capacities via IBN-Net”. In:ECCV2018.
    3. Jie Hu et al. “Squeeze-and ExcitationNetwork”. In:CVPR2018.David Snyder et al. “X-vectors: Robust dnn embeddings forspeaker recognition”. In: Proc. of ICASSP. IEEE. 2018, pp. 5329–5333.
    4. G. Bhattacharya, J. Alam, and P. Kenny.“Deep Speaker Embeddings for Short-Duration Speaker Verification”. In: Proc.Interspeech. 2017, pp. 1517–1521.
    5. Koji Okabe, Takafumi Koshinaka, andKoichi Shinoda. “Attentive Statistics Pooling for Deep Speaker Embedding”. In: Proc. Interspeech.2018, pp. 2252–2256.
    6. Chunlei Zhang and Kazuhito Koishida.“End-to-End Text-Independent Speaker Verificationwith Triplet Loss on Short Utterances”. In: Proc. Interspeech. 2017, pp.1487–1491.
    7. Li Wan et al. “Generalized end-to-endloss for speaker verification”. In: Proc. of ICASSP. 2018, pp. 4879–4883.
    8. Weicheng Cai, Jinkun Chen, and Ming Li.“Exploring the Encoding Layer and Loss Functionin End-to-End Speaker and LanguageRecognition System”. In: Proc. Speaker Odyssey. 2018, pp. 74–81.
    9. Zili Huang, Shuai Wang, and Kai Yu.“Angular Softmax for Short-Duration Text-independentSpeaker Verification.” In: Proc. of Interspeech. 2018, pp. 3623–3627.
    10. Joon Son Chung, Arsha Nagrani, andAndrew Zisserman. “VoxCeleb2: Deep SpeakerRecognition”. In: Proc. INTERSPEECH. 2018, pp. 1086–1090.

    剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。