1. 进行语音/歌声合成,语音/歌声转换,声音复刻等相关方向的先进算法研究和技术实现。 2. 探索语音AIGC大模型的实现与落地。 3. 负责语音数据收集以及处理等相关数据方面工作。 4. 推动技术在咪咕丰富的内容场景中的落地。
1. 统招硕士及以上学历,有良好的中英文文献阅读能力; 2. 熟悉fastspeech, tacotron, hifigan, Vall-E,NaturalSpeech等语音合成领域主流算法模型以及系统解决方案 3. Linux环境下的开发与调试经验,具备较好的 C、C++ 或 python 编程能力,熟悉 TensorFlow 或 PyTorch 等深度学习框架; 4. 具有相关场景落地经验者优先。