下载此文档

面向说话人识别的SVM核方法对比研究.docx


文档分类:IT计算机 | 页数:约3页 举报非法文档有奖
1/3
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/3 下载此文档
文档列表 文档介绍
该【面向说话人识别的SVM核方法对比研究 】是由【niuww】上传分享,文档一共【3】页,该文档可以免费在线阅读,需要了解更多关于【面向说话人识别的SVM核方法对比研究 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。面向说话人识别的SVM核方法对比研究引言面向说话人识别是一个重要的语音信号处理应用,它从语音信号中提取出一些特征信息,用于识别一个人的身份信息。它在语音识别、个人身份识别、语音光盘制作等领域都是非常有应用前途的。支持向量机(SupportVectorMachine,SVM)是一种在模式识别领域中得到广泛应用的机器学习算法,可以用于分类、回归等任务,同时也可用于面向说话人识别。本文将对面向说话人识别的SVM核方法进行对比研究。研究目的本文的目的是比较和分析常用的几种SVM核方法在面向说话人识别中的效果,并探讨影响识别效果的因素。通过对比和分析不同SVM核方法的特点和优缺点,为面向说话人识别的应用提供一些参考意见。研究方法本文将选择常用的四种SVM核方法进行对比研究,分别是:线性核函数、多项式核函数、高斯核函数和sigmoid核函数。选取适量的数据集,包括声纹库,进行实验,比较四种核方法的正确率、速度等指标,探讨它们的优劣势。同时,还要探讨一些影响识别效果的关键因素,包括特征提取、分类器参数、数据集选择等方面。,即LiSEC中文密码语音库。该库中包含了10个不同的人的语音信号,每个人有10条密码语音,语音长度均为1秒。本文从中选取每个人的5条语音作为训练集,另外5条语音作为测试集。每个语音信号均采样到8000Hz,使用Matlab进行预处理,截取有效信号、进行预加重、用Hamming窗函数进行分帧以及对每帧进行离散傅立叶变换(DFT),得到每帧的特征向量。(MelFrequencyCepstralCoefficients)作为特征提取方法。在线性谱上使用一组滤波器将信号分成多个频带,并对每一个频带的线性谱取到对数值。然后对这些对数值使用DCT变换,提取能量和参数,系数。在本文中,系数作为输入向量。,训练集和测试集的标签均为人名,SVM核函数的参数从实验中反复试验得到。,并记录每种方法的识别准确率和运行时间。结果如下表所示:|SVM核方法|正确率|运行时间||----------|-----------|-------------||线性核函数|70%|||多项式核函数|90%|||高斯核函数|95%|||Sigmoid核函数|82%||分析与讨论从表中可以看出,四种SVM核方法在人名识别任务中获得了不同的识别率和运行时间。其中,高斯核函数的识别率最高达到95%,。多项式核函数的识别率在90%左右,但是运行时间比高斯核函数慢约200秒。线性核函数的识别率仅有70%,但是运行时间最短。Sigmoid核函数的识别率相对较高,但是运行时间最长,。综上分析,需要根据具体情况选择最适合的SVM核方法。当数据集线性可分时,使用线性核函数可以获得比较好的识别效果和速度;当数据集非线性可分时,使用高斯核函数可获得较高的识别率和较短的运行时间。多项式核函数和Sigmoid核函数在某些情况下也可达到较好的效果。除核函数外,还有很多因素也会影响人名识别任务的识别效果,例如选择哪些特征(、PLP等)以及特征向量的大小、分类器的参数调整等。在进行实验前,需要对这些因素进行选择和调整,从而得到最优的识别效果。结论本文对面向说话人识别的SVM核方法进行了比较和分析,通过实验数据得出结论:四种SVM核方法在人名识别任务中具有各自的优劣势,需要根据具体情况选择适合的SVM核方法。在实际应用中,还需要考虑其他因素的影响和调整。这对于提高面向说话人识别的准确率和速度具有一定的指导意义。

面向说话人识别的SVM核方法对比研究 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数3
  • 收藏数0 收藏
  • 顶次数0
  • 上传人niuww
  • 文件大小11 KB
  • 时间2025-01-17