当前注册人数384872人 邮箱: 密码: 注册新用户 忘记密码
首页 C/C++/MFC C# ASP.NET VB.NET MATLAB Android   站内搜索 下载代码说明/积分规则
为什么要注册?

1. 可以直接免费从本站下载代码,防止邮件发送不到您的邮箱,或登录不了国外网站

2. 可以设定关键字,当有您关心的代码收录时,邮件通知您

3. 对这里的代码进行评分和评论

4. 可以和大家一起分享你的源代码,得到更多的建议

40万国外源码搜索
200万国内源码搜索
相关源代码

Speech Recoginition

基于DTW的语音识别源程序

2009年05月31日
matlab  热心分享
Matlab
一个非常强大的语音识别程序,包括的技术细节有:DTW动态时间规划、倒谱均值归一化(CMN)、Mel频段倒谱系数(MFCC)、语音端点检测(voice activity detection)、k最近邻法(kNN) 等等。
相关知识

Speech recognition (also known as automatic speech recognition or computer speech recognition) converts spoken words to machine-readable input (for example, to key presses, using the binary code for a string of character codes). The term "voice recognition" is sometimes incorrectly used to refer to speech recognition, when actually referring to speaker recognition, which attempts to identify the person speaking, as opposed to what is being said. Confusingly, journalists and manufacturers of devices that use speech recognition for control commonly use the term Voice Recognition when they mean Speech Recognition.

Mel-frequency cepstral coefficients (MFCCs) are coefficients that collectively make up an MFC. They are derived from a type of cepstral representation of the audio clip (a nonlinear "spectrum-of-a-spectrum"). The difference between the cepstrum and the mel-frequency cepstrum is that in the MFC, the frequency bands are equally spaced on the mel scale, which approximates the human auditory system's response more closely than the linearly-spaced frequency bands used in the normal cepstrum. This frequency warping can allow for better representation of sound.

Voice activity detection (also known as speech activity detection or, more simply, speech detection) is a technique used in speech processing wherein the presence or absence of human speech is detected in regions of audio (which may also contain music, noise, or other sound) [1]. The main uses of VAD are in speech coding and speech recognition. It can facilitate speech processing, and can also be used to deactivate some processes during non-speech segments: it can avoid unnecessary coding/transmission of silence packets in VOIP, saving on computation and on network bandwidth.

 

源代码原文下载:
Source link has yet to be found. Please, try to download it from local website.

源码图片

从本站下载附件及源代码(3个附件,已经成功下载5514次)

最值得关注的外文源代码

Find Peak Value
评论(评论是增加积分的一个有效途径)
字数在300字内
请如实评论
本源代码共评论351次,此处显示最近20次评论! 查看所有评论

joe911  2017年10月09日
下载看看
luxudong_123  2017年05月03日
刚下载
阳光  2017年04月27日
刚下载,还没看
123  2017年02月26日
很好
阿牛流斯  2016年11月14日
下载了,很可以
阿牛流斯  2016年11月14日
谢谢分享,下来学习
lst会飞的面包树  2016年10月18日
谢谢分享啊
day19920115  2016年03月06日
谢谢
ghaithoo  2015年06月01日
thankx alot for your job
gftd  2015年01月08日
想要学习
xxllj  2014年04月23日
thanks very much
laoniusanche  2014年02月10日
的确是想要的
laoniusanche  2014年02月10日
学习下 ,很有价值
lulusuhu00  2013年11月22日
非常有用
guaoqw  2013年11月21日
學習了
jiangp  2013年11月21日
非常非常经典!
fendoujiayou  2013年11月12日
学习中,谢谢。
xxllj  2013年09月16日
很有用
xiaoyi5856  2013年09月16日
还可以Undefined command/function 'mode'.
xiaoyi5856  2013年09月09日
挺好的啊
字数在300字内
请如实评论
相关标签
200万国内源码搜索
CopyRight (C) codesoso.com 2007-2009 All Rights Reserved zhihuishi   免责声明