首页 > 财经 >

妈耶,摆脱机器音,二次宅的歌姬女友彻底“活了”(2)

2018-12-18 00:23:20 网络整理 阅读:83 评论:0

一个基本事实是,虚拟歌姬佐藤莎莎拉是.. CeVIO 公司在 2013 发布的 CeVIO Creative Studio 声音创作软件中的虚拟角色。

公开资料显示,CeVIO Creative Studio 是基于 hts engine 引擎作成的新型语音和歌唱合成的软件,在算法本质上与 VOCALOID & UTAU 等软件的大声库“拼接算法”不同,因此只是较小的声库,但语音和歌唱可以简单而自然地合成,语音合成可以调整参数使虚拟歌姬说话更加接近人声,此外,还会自动加入呼吸声并自动调教。

但这次的技术应该是基于新版的合成引擎,由 CeVIO 的开发方 Techno-Speech 公司与名古屋工业大学国际音声言语技术研究所共同合作。Techno-Speech 在官方新闻稿中称,通过深度学习技术学习特定歌唱者的声质、语癖、演唱风格,并进行合成使之可以演唱任意的歌词和乐谱,只需歌唱者进行约 2 个小时的演唱就可以获取数据。

云知声 AI labs 研发总监告诉 AI科技大本营,上述音频中旧的语音样例应是传统参数合成技术,,缺点是合成声音的质量低,机械音较明显。而新语音样例借助深度学习技术,使得参数建模精度有明显提升,同时,可能使用最新的 WaveNet 声码器,使得合成音质有明显的提升。

另外,与合成自然说话的声音相比,合成歌声的技术要求是不是更高?

上述语音合成专家表示,两者都是数据驱动,但歌唱合成的韵律变化性反而没有自然说话时变化多端,这对数据量的要求也相应要小。歌唱合成需要很精准的韵律恢复,输入的是乐谱,而乐谱中已有很明确的韵律描述,比如某个字应该发多长音、发什么调,都可以通过规则计算出来,并根据结果对合成语音进行调整,从而不会有走调现象。反之,如果韵律恢复不准确,就会有明显走调现象。

相关文章