关于语音信号特征提取和声学模型,正确的有( )。
A: 通过离散傅里叶变换可以得到语音频域特征(频域参数)
B: 梅尔频率倒谱系数是一种反映人耳听感特性的语音声学特征
C: 声学建模单元可以是音素、音节、词语等,此三种的单元粒度递减
D: 一般不单独采用词语为建模单元,主要原因是词语的长度不等且粒度较大
A: 通过离散傅里叶变换可以得到语音频域特征(频域参数)
B: 梅尔频率倒谱系数是一种反映人耳听感特性的语音声学特征
C: 声学建模单元可以是音素、音节、词语等,此三种的单元粒度递减
D: 一般不单独采用词语为建模单元,主要原因是词语的长度不等且粒度较大
举一反三
- 在面向语音识别的声学模型中,建模单元可以是音素、音节、词语等,此三种的单元粒度递增。
- 在面向语音识别的声学模型中,建模单元可以是音素、音节、词语等,此三种的单元粒度依次增加。
- 关于语音信号特征和其提取方法,正确的有() A: 通过离散傅里叶变换可以得到语音频域特征 B: 采用梅尔频率倒谱系数得到符合人耳听感特性的语音声学特征 C: 音强和音长反映了语音信号的频域特征 D: 音高和音色反映了语音信号的时域特征
- 在面向语音识别的声学模型中,建模单元可以是音素、音节、词语等,此三种的单元粒度递增。 A: 正确 B: 错误
- 关于语音识别的说法错误的是( )。 A: 语音识别是将语音自动转换为文字的过程 B: 目前多数声学模型采用音素为建模单元 C: 在其声学模型中常用高斯混合模型对音素(或音节)间的状态转移模式建模 D: 基于深度神经网络的声学模型能学习非线性的、更高层次的语音特征