语音转换的主要方法有码本映射法、高斯混合模型法和深度神经网络法等,以下有关说法错误的是( )
A: 三种方法都要建立源说话人和目标说话人间语音特征的映射关系
B: 码本映射法通过源说话人和目标说话人码本间的映射关系保证语音内部频谱的连续性
C: 高斯混合模型法用混合高斯分布模型表示语音的声学特征
D: 深度神经网络法可以建立源说话人和目标说话人间的非线性映射关系
A: 三种方法都要建立源说话人和目标说话人间语音特征的映射关系
B: 码本映射法通过源说话人和目标说话人码本间的映射关系保证语音内部频谱的连续性
C: 高斯混合模型法用混合高斯分布模型表示语音的声学特征
D: 深度神经网络法可以建立源说话人和目标说话人间的非线性映射关系
举一反三
- 三种代表性的语音转换方法是码本映射法、高斯混合模型法和深度神经网络法。
- 三种代表性的语音转换方法是码本映射法、高斯混合模型法和深度神经网络法。 A: 正确 B: 错误
- 关于深度神经网络法说法错误的是( )。 A: 它可以解决高斯混合模型方法中的过平滑问题 B: 它具有较强的处理高维数据的能力,通常直接使用原始高维的谱包络特征练模型 C: 它通过深层次神经网络模型的非线性建模能力,建立源说话人和目标说话人之间的映射关系 D: 它会给转换特征带来过平滑的问题,导致语音的音质下降
- 关于语音转换中深度神经网络法说法错误的是( )。 A: 它的语音转换性能好,能提高转换语音的话音质量 B: 它具有较强的处理高维数据的能力,通常直接使用原始高维的谱包络特征练模型 C: 它通过深层次神经网络模型的非线性建模能力,建立源说话人和目标说话人之间的映射关系 D: 它的语音转换性能差,导致语音的音质下降
- 关于语音转换中码本映射法说法错误的是( )。 A: 它是一种比较有效的频谱转换算法 B: 它通过从原始语音片段中抽取关键的语音帧作为码本,建立起源说话人和目标说话人参数空间的关系 C: 该方法生成语音的单帧语音保真度较高 D: 它将原始语音片拼接成为转换后的语言