关于语音转换中深度神经网络法说法错误的是( )。
A: 它的语音转换性能好,能提高转换语音的话音质量
B: 它具有较强的处理高维数据的能力,通常直接使用原始高维的谱包络特征练模型
C: 它通过深层次神经网络模型的非线性建模能力,建立源说话人和目标说话人之间的映射关系
D: 它的语音转换性能差,导致语音的音质下降
A: 它的语音转换性能好,能提高转换语音的话音质量
B: 它具有较强的处理高维数据的能力,通常直接使用原始高维的谱包络特征练模型
C: 它通过深层次神经网络模型的非线性建模能力,建立源说话人和目标说话人之间的映射关系
D: 它的语音转换性能差,导致语音的音质下降
举一反三
- 关于深度神经网络法说法错误的是( )。 A: 它可以解决高斯混合模型方法中的过平滑问题 B: 它具有较强的处理高维数据的能力,通常直接使用原始高维的谱包络特征练模型 C: 它通过深层次神经网络模型的非线性建模能力,建立源说话人和目标说话人之间的映射关系 D: 它会给转换特征带来过平滑的问题,导致语音的音质下降
- 语音转换的主要方法有码本映射法、高斯混合模型法和深度神经网络法等,以下有关说法错误的是( ) A: 三种方法都要建立源说话人和目标说话人间语音特征的映射关系 B: 码本映射法通过源说话人和目标说话人码本间的映射关系保证语音内部频谱的连续性 C: 高斯混合模型法用混合高斯分布模型表示语音的声学特征 D: 深度神经网络法可以建立源说话人和目标说话人间的非线性映射关系
- 关于语音转换,错误的是()。 A: 语音转换就是提取并转换说话人相关的声学特征参数 B: 语音转换的目的是通过语音处理改变语音中的说话人个性信息 C: 深度神经网络法是最早应用的语音转换方法 D: 语音转换研究有助于人们了解说话人声学特征参数的决定因素
- 关于语音转换中码本映射法说法错误的是( )。 A: 它是一种比较有效的频谱转换算法 B: 它通过从原始语音片段中抽取关键的语音帧作为码本,建立起源说话人和目标说话人参数空间的关系 C: 该方法生成语音的单帧语音保真度较高 D: 它将原始语音片拼接成为转换后的语言
- 关于高斯混合模型法说法错误的是()。 A: 它使用最小均方误差准则来确定转换函数 B: 它具有软聚类、增量学习和连续概率转换的特点 C: 它所建立的转换函数是不连续的,容易导致语音内部频谱不连续 D: 它会给转换特征带来过平滑的问题,导致语音的音质下降